Tableau Bridge でTableau Cloud からのDatabricks のデータ連携を実現

古川えりか
古川えりか
コンテンツスペシャリスト
CData ODBC ドライバを使って、Tableau Cloud ダッシュボードにDatabricks のデータをTableau Bridge 経由でフィード。

Tableau Bridge は、データソースとのライブ接続を維持したままTableau Cloud にダッシュバードをパブリッシュ可能にします。本記事では、Tableau Bridge を使って、Databricks のデータに連携するワークブックをデータ更新可能な状態でパブリッシュする方法を説明します。

CData ODBC drivers は、Tableau Cloud からDatabricks のデータにノーコードでのアクセスを実現します。ドライバーにはパフォーマンスを向上させるための効率的なデータ処理が組み込まれています。Databricks からTableau Cloud に複雑なSQlクエリを発行すると、ドライバーはファイルタリング、集計などのクエリオペレーションでデータソース側でサポートされているものはDatabricks 側に、JOIN などのサポートされていないクエリはドライバーの内部SQL エンジンにて処理を行います。また、動的なメタデータクエリ機能が実装されており、Tableau からノーコードでDatabricks のデータのネイティブなデータ型を使ってデータを効率的に分析できます。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Databricks をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにDatabricks のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてDatabricks の接続を設定、2.Tableau Bridge 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとDatabricks への接続設定

まずは、本記事右側のサイドバーからDatabricks ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

接続プロパティの指定がまだの場合は、DSN (データソース名)で行います。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。一般的な接続プロパティは以下のとおりです:

Databricks 接続プロパティの取得・設定方法

Databricks クラスターに接続するには、以下のプロパティを設定します。

  • Database:Databricks データベース名。
  • Server:Databricks クラスターのサーバーのホスト名
  • HTTPPath:Databricks クラスターのHTTP パス。
  • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

Databricks への認証

CData は、次の認証スキームをサポートしています。

  • 個人用アクセストークン
  • Microsoft Entra ID(Azure AD)
  • Azure サービスプリンシパル
  • OAuthU2M
  • OAuthM2M

個人用アクセストークン

認証するには、次を設定します。

  • AuthSchemePersonalAccessToken
  • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

DSN を設定する際には、Max Rows プロパティを設定することをお勧めします。これにより取得される行数が制限され、パフォーマンスを向上させます。

Databricks のデータをTableau ダッシュボードに設定

  1. 新しいワークブックで、データソース画面で、その他のデータベース(ODBC) を選択します。システムDSN であるCData Databricks Sys を選択します。
  2. [データベース]メニューでCData を選択します。
  3. [表]ボックスにテーブル名を入力、または[🔎]マーククリックして、テーブル一覧を表示させます。[新しいカスタムSQL]をクリックしてSQL クエリを入力することもできます。この記事ではCustomers テーブルを選択します。
  4. テーブルをJOIN エリアにドラッグします。複数のテーブルを選択することも可能で、ドライバーにビルトインされたSQL エンジンで複雑なデータリクエストでも処理が可能です。
  5. ワークシートタブを選択すると、カラムがディメンションとメジャーに区別されて表示されます。これらをダッシュボードで使ってビジュアライズを行います。
    Tableau で利用するテーブルを選択(Salesforce is shown.)

Tableau Bridge をサービスとして起動する

  1. [サーバー]メニューから[Tableau Bridge クライアントを起動]を選択します。
  2. サイト管理者権限でTableau Bridge にサインインします。
  3. プロンプトが出たら、データをパブリッシュするTableau Cloud サイトを選択します。Bridge クライアントが開き、システムトレーからアクセスできるようになります。
  4. デフォルトで、Tableau Bridge クライアントはApplication モードに設定されています。[Switch to service]を選択してライブ接続が扱えるようにします。
  5. Tableau Cloud サイトに管理者としてログインします。
  6. [設定]->[Bridge]をクリックします。 Tableau Cloud でのTableau Bridge 設定
  7. Bridge 設定では、[Enable Clients to Maintain Live Connections]で、[Enable Tableau Bridge clients to maintain live connections to on-premises data.]をチェックして有効化します。

リアルタイムデータソース接続を設定したTableau ダッシュボードをパブリッシュする

Tableau Bridge とTabelau Online 両方のデータ接続設定が完了したら、Tableau Cloud にワークブックをパブリッシュしましょう。 [サーバー]メニューから[ワークブックのパブリッシュ]をクリックし、ワークブックを指定します。

リアルタイムデータ接続を含むワークブックを公開 (Salesforce is shown.)

公開するワークブックを選択したら、公開設定でCData ODBC Driver for Databricks がワークブックに個別のリアルタイムデータソースとして含まれるようにします。

  1. [データソース]で、オプションをクリックしてワークブックにデータソースを埋め込む編集を行います。
  2. パブリッシュタイプを[Publish Separately]に変更し、認証方法を選択します。
  3. [リアルタイムデータソースへの接続維持]を選択して、パブリッシュボタンを押して完了します。

パブリッシュされたワークブックは、[更新]ボタンを押すことでDatabricks のデータを更新することができます。

Databricks からTableau Bridge へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

はじめる準備はできましたか?

Databricks ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Databricks Icon Databricks ODBC Driver お問い合わせ

Databricks ODBC Driver は、ODBC 接続をサポートする各種ツールからDatabricks へのシームレスな連携を実現します。

Databricks に使い慣れたデータベースのように標準ODBC インターフェースで読み書き。