Tableau で Azure Data Lake Storage のデータ のデータを可視化
CData Drivers for Azure Data Lake Storage を使用すると、標準データアクセス方法でビジネスインテリジェンスツール(Tableau など)と Azure Data Lake Storage のデータを接続できます。 CData JDBC Driver for Azure Data Lake Storage は Windows およびMacOS 上のTableau からの接続をサポートします。この記事では、スキーマの検出と Azure Data Lake Storage のデータ データへのリアルタイムクエリの実行方法について説明します。
NOTE: Tableau 2020.3 以上をご利用の場合は、CData Tableau Connector もご利用いただけます。 Tableau Cloud で Azure Data Lake Storage のデータ に接続する場合は、CData Connect AI をご利用ください。
Tableau で Azure Data Lake Storage に接続
Tableau を起動する前に、.jar ファイルが正しいフォルダに配置されていることを確認してください。
- Windows: C:\Program Files\Tableau\Drivers
- MacOS: ~/Library/Tableau/Drivers
.jar ファイルを配置したら、すぐに接続を確立できます。
- Tableau を起動します。
- サーバーへ で その他 を選択します。
- その他のデータベース (JDBC) を選択します。
- URL フィールドに JDBC 接続文字列を入力します。
- Account:ストレージアカウントの名前
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます
- ADLS Gen2ストレージアカウントにアクセスします
- 設定でアクセスキーを選択します
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします
- AuthScheme:AccessKey
- AccessKey:先ほどAzure ポータルで取得したアクセスキーの値
- AuthScheme:SAS
- SharedAccessSignature:先ほど生成した共有アクセス署名の値
- サインイン をクリックします。
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen2 への接続
それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。
Azure Data Lake Storage Gen2への認証
続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。
アクセスキー
アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。
Azure ポータルでの手順は以下のとおりです:
接続の準備ができたら、以下のプロパティを設定してください。
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、以下のプロパティを設定してください。
その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。
組み込みの接続文字列デザイナー
JDBC URL の構成を簡単にするには、Azure Data Lake Storage JDBC Driver に組み込まれている接続文字列デザイナーをご利用ください。.jar ファイルをダブルクリックするか、コマンドラインから実行します。
Windows の場合:
java -jar 'C:\Program Files\CData[product_name]\lib\cdata.jdbc.adls.jar'
MacOS の場合:
java -jar cdata.jdbc.adls.jar
接続プロパティを設定し、接続文字列をクリップボードにコピーします。
JDBC URL を構成する際に、Max Rows 接続プロパティの設定をお勧めします。返される行数が制限されるため、特にレポートやビジュアライゼーションの設計時にパフォーマンスが向上します。
以下は、デザイナーで作成したサンプル URL です。
jdbc:adls:Schema=ADLSGen2;Account=myAccount;FileSystem=myFileSystem;AccessKey=myAccessKey;
スキーマの検出とデータクエリ
- データベース プルダウンメニューから CData を選択します。
- スキーマ プルダウンメニューから CData を選択します。
- テーブルを結合エリアにドラッグします。複数のテーブルを含めることができます。
- 今すぐ更新 または 自動更新 を選択します。「今すぐ更新」はデータソースの最初の10,000 行をプレビューします(行数はRows テキストボックスで変更可能)。「自動更新」はプレビューエリアの変更を自動的に反映します。
- 「接続」メニューで ライブ オプションを選択すると、Tableau にデータのコピーをロードせず、リアルタイムデータを直接操作できます。
- ワークシートのタブをクリックします。カラムはデータ型に応じて「ディメンション」と「メジャー」に分類されます。CData ドライバーはデータ型を自動で検出するため、Tableau の強力なデータ処理および可視化機能を活用できます。
- ディメンション または メジャー エリアからフィールドを 行 または 列 にドラッグします。Tableau がカラムまたは行のヘッダーを作成します。
- 表示形式 タブからグラフの種類を選択します。選択したグラフが Tableau に表示されます。
CData JDBC Driver for Azure Data Lake Storage と Tableau を使用して、Azure Data Lake Storage のデータ に対する堅牢なビジュアライゼーションとレポートを簡単に作成できます。30日間の無償トライアルをダウンロードして、今すぐお試しください。