【ノーコード】Power BI Service でAzure Data Lake Storage のデータをリアルタイムでビジュアライズ
Power BI を使えば組織のデータをリッチなビジュアルに変換して収集および整理することができるため、重要なことだけに集中できます。CData Connect AI と組み合わせると、ビジュアライゼーションやダッシュボード用にAzure Data Lake Storage のデータにクラウドベースでアクセスできます。この記事では、Power BI のAzure Data Lake Storage のデータからデータセットを構築して公開し、Power BI サービスのAzure Data Lake Storage のデータに関するレポートを作成する方法について説明します。
CData Connect AI は、ピュアSQL のクラウドインターフェースをAzure Data Lake Storage に提供し、データを複製せずにPower BI のリアルタイムAzure Data Lake Storage のデータと簡単に統合できるようにします。ビジュアライゼーションを作成すると、Power BI はデータを収集するためのSQL クエリを生成します。CData Connect AI は、最適化されたデータ処理を使用してサポートされているすべてのSQL 操作(フィルタ、JOIN など)をAzure Data Lake Storage に直接プッシュし、サーバー側の処理を利用して、要求されたAzure Data Lake Storage のデータを高速で返します。
Connect AI からAzure Data Lake Storage に接続する
CData Connect AI は直感的なクリック操作ベースのインターフェースを使ってデータソースに接続します。- Connect AI にログインし、 Add Connection をクリックします。
- Add Connection パネルから「Azure Data Lake Storage」を選択します。
-
必要な認証プロパティを入力し、Azure Data Lake Storage に接続します。
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen2 への接続
それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。
- Account:ストレージアカウントの名前
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます
Azure Data Lake Storage Gen2への認証
続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。
アクセスキー
アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。
Azure ポータルでの手順は以下のとおりです:
- ADLS Gen2ストレージアカウントにアクセスします
- 設定でアクセスキーを選択します
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:AccessKey
- AccessKey:先ほどAzure ポータルで取得したアクセスキーの値
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:SAS
- SharedAccessSignature:先ほど生成した共有アクセス署名の値
その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。
- Create & Test をクリックします。
- Edit Azure Data Lake Storage Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。
パーソナルアクセストークンの追加
OAuth 認証をサポートしていないサービス、アプリケーション、プラットフォーム、またはフレームワークから接続する場合は、認証に使用するパーソナルアクセストークン(PAT)を作成できます。きめ細かなアクセス管理を行うために、サービスごとに個別のPAT を作成するのがベストプラクティスです。
- Connect AI アプリの右上にあるユーザー名をクリックし、User Profile をクリックします。
- User Profile ページでPersonal Access Token セクションにスクロールし、 Create PAT をクリックします。
- PAT の名前を入力して Create をクリックします。
- パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。
コネクションが構成されたら、Power BI からAzure Data Lake Storage に接続できるようになります。
Power BI からConnect AI に接続する
Power BI サービスでリアルタイムAzure Data Lake Storage のデータに接続してビジュアライズするには、オンプレミスデータゲートウェイをインストールしてPower BI サービスからゲートウェイにデータソースを追加し、Power BI Desktop からサービスにデータセットを公開します。
オンプレミスデータゲートウェイをインストールする
Microsoft オンプレミスデータゲートウェイは、接続されたデータソースとさまざまなクラウドベースのMicrosoft ツールおよびプラットフォーム間の安全なデータ転送を提供します。ゲートウェイの詳細については、Microsoft のドキュメントを参照してください。
Power BI サービスからゲートウェイをダウンロードし、インストールできます。
- PowerBI.com にログインします。
- 「Download」メニューをクリックし、「Data Gateway」をクリックします。

- インストールの手順に従ってゲートウェイの名前をメモします。
Azure Data Lake Storage をデータソースとしてPower BI サービスに追加する
データゲートウェイをインストールしたら、Connect AI をデータソースとしてPower BI サービスに追加します。
- PowerBI.com にログインします。
- 「Settings」メニューをクリックして「Manage gateways」をクリックします。

- 「ADD DATA SOURCE」をクリックしてConnect AI への接続を構成します。
- Data Source Name をConnectCloudADLS に設定します。
- Data Source Type としてSQL Server を選択します。
- Server を tds.cdata.com,14333 に設定します。
- Database をAzure Data Lake Storage コネクションの名前に設定します。(例:ADLS1)
- Authentication Method をBasic に設定します。
- Username をConnect AI のユーザーに設定します。(user@mydomain.com)
- Password をユーザーのPAT に設定します。
Power BI Desktop からデータセットを公開する
ゲートウェイをインストールし、Connect AI をデータソースとしてPower BI サービスに追加すると、Power BI Desktop からサービスにデータセットを公開できます。
- Power BI を開いて「Get Data」-->「More」とクリックし、SQL Server データベースを選択して「Connect」をクリックします。
- 接続プロパティを設定し、「OK」をクリックします。
- Server をtds.cdata.com,14333 に設定します。
- Database をAzure Data Lake Storage コネクションの名前に設定します。(例:ADLS1)
- Data Connectivity mode をDirectQuery* に設定します。
* DirectQuery は、Azure Data Lake Storage のデータのリアルタイムクエリ処理とリアルタイムのビジュアライゼーションを可能にします。
- 「authentication」ウィザードで「Database」を選択してUser name とPassword のプロパティを設定し、「Connect」をクリックします。
- 「Navigator」ダイアログでテーブルを選択し、ビジュアライズします。
「Query Editor」では、Azure Data Lake Storage カラムをフィルタリング、並べ替え、要約することでデータセットをカスタマイズできます。「Edit」をクリックしてクエリエディタを開きます。行をフィルタするには、行を右クリックします。カラムヘッダーを右クリックして、次のオプションを実行します。
- カラムのデータタイプを変更
- カラムの削除
- カラムをグループ化
Power BI は、Connect AI によって報告されたAzure Data Lake Storage メタデータから、各カラムのデータタイプを検出します。
Power BI は、クエリへの変更を「Applied Steps」セクションに記録し、リモートAzure Data Lake Storage のデータに対して実行される、基礎となるデータ取得クエリを調整します。「Close and Apply」をクリックすると、Power BI はデータ取得クエリを実行します。
もしくは、「Load」をクリックしてデータをPower BI にプルします。
- 「Relationships」タブで選択したエンティティ間のリレーションを定義します。
- 「Home」メニューから「Publish」をクリックして「Workspace」を選択します。
Power BI Service からAzure Data Lake Storage のデータを使ってレポートとダッシュボードを作成する
Power BI サービスにデータセットを公開したので、公開されたデータに基づいて新しいレポートとダッシュボードを作成できます。
- PowerBI.com にログインします。
- 「Workspaces」をクリックし、ワークスペースを選択します。
- 「Create」をクリックし、「Report」を選択します。
- レポート用に公開されたデータセットを選択します。

- フィールドとビジュアライゼーションを選択してレポートを追加します。

クラウドアプリケーションからAzure Data Lake Storage のデータへのSQL アクセス
Power BI サービスからAzure Data Lake Storage のデータへリアルタイムで直接接続ができるようになりました。これで、Azure Data Lake Storage を複製せずにより多くのデータソースや新しいビジュアライゼーション、レポートを作成することができます。
クラウドアプリケーションから直接100を超えるSaaS 、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスを取得するには、CData Connect AI をお試しください。