Tableau で Azure Data Lake Storage のデータ のデータを可視化

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Tableau Desktop BI ツールで Azure Data Lake Storage のデータ に接続。

CData Drivers for Azure Data Lake Storage を使用すると、標準データアクセス方法でビジネスインテリジェンスツール(Tableau など)と Azure Data Lake Storage のデータを接続できます。 CData JDBC Driver for Azure Data Lake Storage は Windows およびMacOS 上のTableau からの接続をサポートします。この記事では、スキーマの検出と Azure Data Lake Storage のデータ データへのリアルタイムクエリの実行方法について説明します。

NOTE: Tableau 2020.3 以上をご利用の場合は、CData Tableau Connector もご利用いただけます。 Tableau Cloud で Azure Data Lake Storage のデータ に接続する場合は、CData Connect AI をご利用ください。

Tableau で Azure Data Lake Storage に接続

Tableau を起動する前に、.jar ファイルが正しいフォルダに配置されていることを確認してください。

  • Windows: C:\Program Files\Tableau\Drivers
  • MacOS: ~/Library/Tableau/Drivers

.jar ファイルを配置したら、すぐに接続を確立できます。

  1. Tableau を起動します。
  2. サーバーへその他 を選択します。
  3. その他のデータベース (JDBC) を選択します。
  4. URL フィールドに JDBC 接続文字列を入力します。
  5. Azure Data Lake Storage 接続プロパティの取得・設定方法

    Azure Data Lake Storage Gen2 への接続

    それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。

    • Account:ストレージアカウントの名前
    • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
    • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます

    Azure Data Lake Storage Gen2への認証

    続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。

    アクセスキー

    アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

    Azure ポータルでの手順は以下のとおりです:

    1. ADLS Gen2ストレージアカウントにアクセスします
    2. 設定でアクセスキーを選択します
    3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします

    接続の準備ができたら、以下のプロパティを設定してください。

    • AuthSchemeAccessKey
    • AccessKey:先ほどAzure ポータルで取得したアクセスキーの値

    共有アクセス署名(SAS)

    共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。

    接続の準備ができたら、以下のプロパティを設定してください。

    • AuthSchemeSAS
    • SharedAccessSignature:先ほど生成した共有アクセス署名の値

    その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。

    組み込みの接続文字列デザイナー

    JDBC URL の構成を簡単にするには、Azure Data Lake Storage JDBC Driver に組み込まれている接続文字列デザイナーをご利用ください。.jar ファイルをダブルクリックするか、コマンドラインから実行します。

    Windows の場合:

    java -jar 'C:\Program Files\CData[product_name]\lib\cdata.jdbc.adls.jar'
    

    MacOS の場合:

    java -jar cdata.jdbc.adls.jar
    

    接続プロパティを設定し、接続文字列をクリップボードにコピーします。

    JDBC URL を構成する際に、Max Rows 接続プロパティの設定をお勧めします。返される行数が制限されるため、特にレポートやビジュアライゼーションの設計時にパフォーマンスが向上します。

    以下は、デザイナーで作成したサンプル URL です。

    jdbc:adls:Schema=ADLSGen2;Account=myAccount;FileSystem=myFileSystem;AccessKey=myAccessKey;
    
  6. サインイン をクリックします。

スキーマの検出とデータクエリ

  1. データベース プルダウンメニューから CData を選択します。
  2. スキーマ プルダウンメニューから CData を選択します。
  3. テーブルを結合エリアにドラッグします。複数のテーブルを含めることができます。
  4. 今すぐ更新 または 自動更新 を選択します。「今すぐ更新」はデータソースの最初の10,000 行をプレビューします(行数はRows テキストボックスで変更可能)。「自動更新」はプレビューエリアの変更を自動的に反映します。
  5. 「接続」メニューで ライブ オプションを選択すると、Tableau にデータのコピーをロードせず、リアルタイムデータを直接操作できます。
  6. ワークシートのタブをクリックします。カラムはデータ型に応じて「ディメンション」と「メジャー」に分類されます。CData ドライバーはデータ型を自動で検出するため、Tableau の強力なデータ処理および可視化機能を活用できます。
  7. ディメンション または メジャー エリアからフィールドを または にドラッグします。Tableau がカラムまたは行のヘッダーを作成します。
  8. 表示形式 タブからグラフの種類を選択します。選択したグラフが Tableau に表示されます。

CData JDBC Driver for Azure Data Lake Storage と Tableau を使用して、Azure Data Lake Storage のデータ に対する堅牢なビジュアライゼーションとレポートを簡単に作成できます。30日間の無償トライアルをダウンロードして、今すぐお試しください。

はじめる準備はできましたか?

Azure Data Lake Storage Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Azure Data Lake Storage Icon Azure Data Lake Storage JDBC Driver お問い合わせ

Azure Data Lake Storage データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。