Birst でAzure Data Lake Storage データのビジュアライゼーションを構築
Birst は、組織が複雑なプロセスを迅速に理解し、最適化することを支援するクラウドビジネスインテリジェンス(BI)ツールおよび分析プラットフォームです。CData JDBC Driver for ADLS と組み合わせると、Birst Cloud Agent を経由してリアルタイムAzure Data Lake Storage のデータ に接続し、ビジュアライズを構築できます。ここでは、Cloud Agent を使用してAzure Data Lake Storage に連携し、Birst で動的レポートを作成する方法を段階的に説明します。
強力なデータ処理機能により、CData JDBC Driver はBirst のAzure Data Lake Storage のデータ 操作に高いパフォーマンスを提供します。Birst からAzure Data Lake Storage への複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作を直接Azure Data Lake Storage にプッシュし、組込みSQL エンジンを利用してクライアント側でサポートしない操作を処理します。組み込みの動的メタデータクエリにより、JDBC ドライバーはネイティブのBirst データ型を使用してAzure Data Lake Storage のデータ を視覚化および分析することを可能にします。
Birst でAzure Data Lake Storage データへのJDBC 接続を設定
Birst プロジェクトを作成する前に、JDBC Driver を操作するためのBirst Cloud Agent をインストールする必要があります。また、JDBC ドライバーのJAR ファイル(および存在する場合はLIC ファイル)をCloud Agent のインストール場所の/drivers/ ディレクトリにコピーします。
ドライバーとCloud Agent のインストールが完了したら、開始できます。
- Birst で新しいプロジェクトを作成します。
- 接続に名前を付けます。(e.g. CDataADLS)
- Live Access を選択します。
- エージェントを選択します。
- Database Type をOther に設定します。
- SQL タイプをMSSQL に設定します。
- 接続文字列を設定します。
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen2 への接続
それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。
- Account:ストレージアカウントの名前
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます
Azure Data Lake Storage Gen2への認証
続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。
アクセスキー
アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。
Azure ポータルでの手順は以下のとおりです:
- ADLS Gen2ストレージアカウントにアクセスします
- 設定でアクセスキーを選択します
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:AccessKey
- AccessKey:先ほどAzure ポータルで取得したアクセスキーの値
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:SAS
- SharedAccessSignature:先ほど生成した共有アクセス署名の値
その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。
ビルトイン接続文字列デザイナー
JDBC URL の構成については、Azure Data Lake Storage JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.adls.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
JDBC URL を構成する際、Max Rows 接続プロパティを設定することもできます。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。
以下はAzure Data Lake Storage の一般的なJDBC 接続文字列です。
jdbc:adls:Schema=ADLSGen2;Account=myAccount;FileSystem=myFileSystem;AccessKey=myAccessKey;
- Driver Name cdata.jdbc.adls.ADLSDriver を設定し、[Save]をクリックします。
NOTE Azure Data Lake Storage への認証は接続文字列に管理されるため、[Security Credentials]は空白でも問題ありません。
Azure Data Lake Storage データオブジェクトを設定
接続が構成されたら、データセットのスキーマを構成し、ビジュアライズするテーブル、ビュー、そしてカラムを選択することができるようになります。
- スキーマを選択します。 (e.g. ADLS)
- [Tables]や[Views]をクリックしてこれらのエンティティに接続し、[Apply]をクリックします。
- アクセスする[Tables]と[Columns]を選択し、[Done]をクリックします。
オブジェクトが構成されたら、Pronto Prepare and Relate ツールを用いて、データ準備の実行やデータのリレーションを検出できるようになります。
ビジュアライゼーションを構築
データを準備し、接続されたオブジェクト間のリレーションを定義することで、ビジュアライゼーションを構築することができるようになります。
- メニューから、Visualizer ツールを選択します。
- オブジェクトからMeasures & Categories を選択します。
- 選択したMeasure(s) に適切なビジュアライゼーションを選択し、構成します。
CData JDBC Driver for ADLS をCloud Agent やBirst とともに用いることにより、Azure Data Lake Storage で簡単に堅牢なビジュアライゼーションとレポートを作成できます。30日の無償評価版をダウンロードし、Birst ビジュアライゼーションの構築を開始してください。