【完全ガイド】Power BI × Azure Data Lake Storage連携 - SQLなしでAzure Data Lake Storageのデータを分析・可視化
CData Power BI Connectors は、セルフサービスBI であるMicrosoft Power BI のデータソースをAzure Data Lake Storage を含む270種類以上のSaaS / DB に拡充、分析や可視化を実現します。もちろん、ダッシュボードでAzure Data Lake Storage のデータをモニタリングしたり、定期更新やリアルタイムでのデータ更新も自在に可能。この記事では、Power BI Connector を使用してPower BI Desktop からAzure Data Lake Storage の可視化を作成する方法について詳しく説明します。
クラウド提供のPowerBI.com へのAzure Data Lake Storage レポートの発行(パブリッシュ)方法については、こちらの記事をご参照ください。
CData Power BI Connectors とは?:SQL・コーディングなしでAzure Data Lake Storage のデータを活用
CData Power BI Connectors は、以下の特徴を持つPower BI とのリアルタイムデータ連携ソリューションです。
- Azure Data Lake Storage をはじめとする、CRM、MA、グループウェア、広告、会計ツールなど多様な270種類以上のSaaS / DB に対応
- ノーコードでの手軽な接続設定。SQL・コーディングは必要ありません
- DirectQuery に対応し、大容量データの動的な取得・更新も可能
- 標準SQL での柔軟なデータ読み込み
CData Power BI Connectors では、1.データソースとしてAzure Data Lake Storage の接続を設定、2.Power BI 側でコネクタとの接続を設定、という2ステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData Power BI Connector のインストールとAzure Data Lake Storage への接続設定
まずは、本記事右側のサイドバーからADLS Power BI Connector の無償トライアルをダウンロード・インストールしてください。30日間無料で製品版の全機能が使用できます。
Power BI のデータソースとしてAzure Data Lake Storage を設定
CData Power BI Connector をインストールすると完了後にDSN 設定画面が開きます。ここでAzure Data Lake Storage への接続を設定します。もしDSN 設定画面が開かない場合は、手動で「ODBC データソース アドミニストレータ(DSN)」プログラムを開いてください。
DSN 内の「CData PBI ADLS」を選択します。DSN 設定画面で必要な資格情報を入力してAzure Data Lake Storage のデータに接続します。入力後に接続のテストを行い、OK をクリックすれば接続は完了です。埋め込みOAuth に対応したデータソースであれば、「接続テスト」をクリックするとログイン画面が立ち上がり、ログインを完了するだけで接続設定が完了します。簡単ですね!
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen2 への接続
それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。
- Account:ストレージアカウントの名前
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます
Azure Data Lake Storage Gen2への認証
続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。
アクセスキー
アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。
Azure ポータルでの手順は以下のとおりです:
- ADLS Gen2ストレージアカウントにアクセスします
- 設定でアクセスキーを選択します
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:AccessKey
- AccessKey:先ほどAzure ポータルで取得したアクセスキーの値
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:SAS
- SharedAccessSignature:先ほど生成した共有アクセス署名の値
その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。
これで、Azure Data Lake Storage のデータをPower BI に連携するための準備は完了です!いよいよPower BI からAzure Data Lake Storage のデータを取得していきます。
Azure Data Lake Storage テーブルをPower BI からクエリ
それでは、実際にPower BI からAzure Data Lake Storage のデータを取得してみましょう。
- Power BI Desktop を開き、「データ」->「データを取得」->「その他」->「CData ADLS」を選択して接続を押します。次にサードパーティドライバーのプロンプトが出る場合には、そのまま続行します。
- CData PBI ADLS を「Data Source Name」欄に入力します。データ接続モードを選択します:
インポート:データをプロジェクトにインポートする場合。オンデマンドで更新が可能。
DirectQuery:Azure Data Lake Storage のデータとリアルタイムで連携する場合。 - ナビゲーターダイアログで使用するテーブルを選択します。選択したら、「読み込み」ボタンをクリックしてデータを取得します。
- (オプション)データをそのまま読み込まず、「データの変換」を使ってデータをカスタマイズすることもできます。例えば、以下の操作が可能です。必要に応じて試してみてください。
- カラムのデータ型の変更
- カラムの削除
- カラムのグルーピング
Power BI は、コネクタが取得・検出したAzure Data Lake Storage のカラム毎のデータ型をそのまま使えます。データ変換を取得して、指定した条件でクエリを発行し、Azure Data Lake Storage からデータを取得します。
Azure Data Lake Storage のデータを分析・可視化
データをPower BI で取得したら、いよいよ可視化に活用できます!レポートビューで取得したAzure Data Lake Storage フィールドをドラッグ&ドロップして可視化を作成していきましょう。グラフの種類を可視化ペインから選択し、フィールドのカラムをドラッグして設定します。
「更新」をクリックすると、その時点でのリアルタイムデータをAzure Data Lake Storage から取得してレポートに反映させることができます。
これで、Azure Data Lake Storage のデータのPower BI での可視化ができました!あとは可視化を追加したり、フィルタリングや集計、データ変換などPower BI のパワフルな機能を活用して分析、レポーティング、ダッシュボード構築などさまざまな用途で利用できます。
Azure Data Lake Storage からPower BI へのデータ連携には、CData Power BI Connector をご利用ください
本記事で紹介したようにCData Power BI Connectors と併用することで、270を超えるSaaS、NoSQL、DB のデータをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData Power BI Connector は日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。製品の使用方法、購入方法などについてご質問がありました、お気軽にお問い合わせください。
よくある質問(FAQ)
Azure Data Lake Storage とPower BI の連携に関するとくある質問にお答えします。