DBxtra でDatabricks のデータを使ってダッシュボードを構築

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
DBxtra でDatabricks のデータを基にしたダイナミックなダッシュボードの作成やデータ分析を行う方法を解説します。

CData のDatabricks 用 ODBC ドライバーは、ODBC 標準経由でDatabricks のリアルタイムデータにアクセスし、使い慣れた SQL クエリで各種 BI、レポート、ETL ツールからDatabricks のデータを利用可能にします。この記事では、汎用 ODBC データプロバイダーとしてDatabricks に接続し、DBxtra でDatabricks のデータを基にしたチャート、レポート、ダッシュボードを作成する方法を解説します。

Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


Databricks のデータへの接続設定

  1. まだ設定していない場合は、データソース名(DSN)で必要な接続プロパティを指定します。DSN の設定は組み込みの Microsoft ODBC データソースアドミニストレーターを使用して行えます。これはドライバーインストールの最終ステップでもあります。Microsoft ODBC データソースアドミニストレーターを使用して DSN を作成・設定する方法については、ヘルプドキュメントの「はじめに」の章をご参照ください。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • 個人用アクセストークン
    • Microsoft Entra ID(Azure AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    個人用アクセストークン

    認証するには、次を設定します。

    • AuthSchemePersonalAccessToken
    • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

    DSN を設定する際には、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数が制限され、レポートやビジュアライゼーションの設計時にパフォーマンスを向上させるのに役立ちます。

  2. DBxtra アプリケーションを開き、New メニューから Project をクリックしてプロジェクト名を入力します。
  3. Data Connection Type として ODBC Connection を選択します。
  4. Data Source の参照オプション()をクリックします。
  5. Data Link Properties ウィンドウの Provider タブで、Microsoft OLE DB Provider for ODBC Drivers を選択します。
  6. Connection タブで、Data Source Name と使用する初期カタログ(CData)を選択します。
  7. 接続名を入力し、適切なユーザーグループを選択します。
  8. プロジェクト内で接続をダブルクリックしてデータに接続します。

Databricks のデータでダッシュボードを作成

これでDatabricks のデータを使ってダッシュボードを作成する準備が整いました。

  1. プロジェクト内の Report Objects を右クリックし、New Report Object を選択します。
  2. 新しい Report Object で、リンクをクリックしてクエリを作成します。
  3. Select Data Connection ウィンドウで、先ほど作成したデータ接続を選択します。
  4. Query タブで、接続オブジェクトを展開し、ダッシュボードに含めたいテーブル、ビュー、特定のカラムを選択します。検索条件を指定したり、JOIN や集計を含む複雑なクエリを作成することもできます。
  5. Dashboard タブで、ダッシュボードのビジュアライゼーションと機能を選択します。クエリからのデータ値をダッシュボード項目の適切なフィールド(Values、Series など)に割り当てます。

新しいダッシュボードが作成されたら、Databricks のデータ分析を開始できます。Databricks 用 ODBC ドライバーのおかげで、ダッシュボードを更新すればソースで行われた変更を即座に確認できます。同様に、常に最新のDatabricks データを反映したレポートを作成・表示できます。

はじめる準備はできましたか?

Databricks ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Databricks Icon Databricks ODBC Driver お問い合わせ

Databricks ODBC Driver は、ODBC 接続をサポートする各種ツールからDatabricks へのシームレスな連携を実現します。

Databricks に使い慣れたデータベースのように標準ODBC インターフェースで読み書き。