Tableau Bridge でTableau Cloud からのAzure Data Lake Storage のデータ連携を実現

古川えりか
古川えりか
コンテンツスペシャリスト
CData ODBC ドライバを使って、Tableau Cloud ダッシュボードにAzure Data Lake Storage のデータをTableau Bridge 経由でフィード。

Tableau Bridge は、データソースとのライブ接続を維持したままTableau Cloud にダッシュバードをパブリッシュ可能にします。本記事では、Tableau Bridge を使って、Azure Data Lake Storage のデータに連携するワークブックをデータ更新可能な状態でパブリッシュする方法を説明します。

CData ODBC drivers は、Tableau Cloud からAzure Data Lake Storage のデータにノーコードでのアクセスを実現します。ドライバーにはパフォーマンスを向上させるための効率的なデータ処理が組み込まれています。Azure Data Lake Storage からTableau Cloud に複雑なSQlクエリを発行すると、ドライバーはファイルタリング、集計などのクエリオペレーションでデータソース側でサポートされているものはAzure Data Lake Storage 側に、JOIN などのサポートされていないクエリはドライバーの内部SQL エンジンにて処理を行います。また、動的なメタデータクエリ機能が実装されており、Tableau からノーコードでAzure Data Lake Storage のデータのネイティブなデータ型を使ってデータを効率的に分析できます。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Azure Data Lake Storage をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにAzure Data Lake Storage のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてAzure Data Lake Storage の接続を設定、2.Tableau Bridge 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとAzure Data Lake Storage への接続設定

まずは、本記事右側のサイドバーからADLS ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

接続プロパティの指定がまだの場合は、DSN (データソース名)で行います。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。一般的な接続プロパティは以下のとおりです:

Azure Data Lake Storage 接続プロパティの取得・設定方法

Azure Data Lake Storage Gen2 への接続

それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。

  • Account:ストレージアカウントの名前
  • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
  • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます

Azure Data Lake Storage Gen2への認証

続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。

アクセスキー

アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

Azure ポータルでの手順は以下のとおりです:

  1. ADLS Gen2ストレージアカウントにアクセスします
  2. 設定でアクセスキーを選択します
  3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします

接続の準備ができたら、以下のプロパティを設定してください。

  • AuthSchemeAccessKey
  • AccessKey:先ほどAzure ポータルで取得したアクセスキーの値

共有アクセス署名(SAS)

共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。

接続の準備ができたら、以下のプロパティを設定してください。

  • AuthSchemeSAS
  • SharedAccessSignature:先ほど生成した共有アクセス署名の値

その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。

DSN を設定する際には、Max Rows プロパティを設定することをお勧めします。これにより取得される行数が制限され、パフォーマンスを向上させます。

Azure Data Lake Storage のデータをTableau ダッシュボードに設定

  1. 新しいワークブックで、データソース画面で、その他のデータベース(ODBC) を選択します。システムDSN であるCData ADLS Sys を選択します。
  2. [データベース]メニューでCData を選択します。
  3. [表]ボックスにテーブル名を入力、または[🔎]マーククリックして、テーブル一覧を表示させます。[新しいカスタムSQL]をクリックしてSQL クエリを入力することもできます。この記事ではResources テーブルを選択します。
  4. テーブルをJOIN エリアにドラッグします。複数のテーブルを選択することも可能で、ドライバーにビルトインされたSQL エンジンで複雑なデータリクエストでも処理が可能です。
  5. ワークシートタブを選択すると、カラムがディメンションとメジャーに区別されて表示されます。これらをダッシュボードで使ってビジュアライズを行います。
    Tableau で利用するテーブルを選択(Salesforce is shown.)

Tableau Bridge をサービスとして起動する

  1. [サーバー]メニューから[Tableau Bridge クライアントを起動]を選択します。
  2. サイト管理者権限でTableau Bridge にサインインします。
  3. プロンプトが出たら、データをパブリッシュするTableau Cloud サイトを選択します。Bridge クライアントが開き、システムトレーからアクセスできるようになります。
  4. デフォルトで、Tableau Bridge クライアントはApplication モードに設定されています。[Switch to service]を選択してライブ接続が扱えるようにします。
  5. Tableau Cloud サイトに管理者としてログインします。
  6. [設定]->[Bridge]をクリックします。 Tableau Cloud でのTableau Bridge 設定
  7. Bridge 設定では、[Enable Clients to Maintain Live Connections]で、[Enable Tableau Bridge clients to maintain live connections to on-premises data.]をチェックして有効化します。

リアルタイムデータソース接続を設定したTableau ダッシュボードをパブリッシュする

Tableau Bridge とTabelau Online 両方のデータ接続設定が完了したら、Tableau Cloud にワークブックをパブリッシュしましょう。 [サーバー]メニューから[ワークブックのパブリッシュ]をクリックし、ワークブックを指定します。

リアルタイムデータ接続を含むワークブックを公開 (Salesforce is shown.)

公開するワークブックを選択したら、公開設定でCData ODBC Driver for Azure Data Lake Storage がワークブックに個別のリアルタイムデータソースとして含まれるようにします。

  1. [データソース]で、オプションをクリックしてワークブックにデータソースを埋め込む編集を行います。
  2. パブリッシュタイプを[Publish Separately]に変更し、認証方法を選択します。
  3. [リアルタイムデータソースへの接続維持]を選択して、パブリッシュボタンを押して完了します。

パブリッシュされたワークブックは、[更新]ボタンを押すことでAzure Data Lake Storage のデータを更新することができます。

Azure Data Lake Storage からTableau Bridge へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

はじめる準備はできましたか?

Azure Data Lake Storage ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Azure Data Lake Storage Icon Azure Data Lake Storage ODBC Driver お問い合わせ

Azure Data Lake Storage ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからAzure Data Lake Storage にデータ連携。

Azure Data Lake Storage にデータベースと同感覚でアクセスして、Azure Data Lake Storage データに使い慣れたODBC インターフェースで連携。