Clear Analytics でDatabricks のデータを使ってチャートを作成

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Clear Analytics でDatabricks のデータ を基にした動的なチャートを作成し、分析を実行。

CData ODBC ドライバー for Databricks は、ODBC 標準を介してDatabricks のライブデータへのアクセスを可能にし、さまざまな BI、レポート、ETL ツールでDatabricks のデータ を直接扱うことができます。この記事では、Microsoft Excel のアドインである Clear Analytics を使って、Databricks に ODBC データソースとして接続し、Databricks のデータ を基にしたクエリ、テーブル、チャート(PivotTable を含む)を作成する方法を説明します。

Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


Databricks のデータに接続


ODBC データソース名の設定

まだ設定していない場合は、データソース名(DSN)で必要な接続プロパティを指定します。Microsoft ODBC データソースアドミニストレーターを使って DSN を作成・設定できます。これはドライバーインストールの最終ステップでも可能です。Microsoft ODBC データソースアドミニストレーターを使った DSN の作成と設定方法については、ヘルプドキュメントの「はじめに」を参照してください。

Databricks 接続プロパティの取得・設定方法

Databricks クラスターに接続するには、以下のプロパティを設定します。

  • Database:Databricks データベース名。
  • Server:Databricks クラスターのサーバーのホスト名
  • HTTPPath:Databricks クラスターのHTTP パス。
  • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

Databricks への認証

CData は、次の認証スキームをサポートしています。

  • 個人用アクセストークン
  • Microsoft Entra ID(Azure AD)
  • Azure サービスプリンシパル
  • OAuthU2M
  • OAuthM2M

個人用アクセストークン

認証するには、次を設定します。

  • AuthSchemePersonalAccessToken
  • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

DSN を設定する際、Max Rows 接続プロパティを設定することもできます。これにより返される行数が制限され、レポートやビジュアライゼーションを作成する際のパフォーマンス向上に役立ちます。

Clear Analytics でデータソースを設定

  1. Excel を開き、CLEAR ANALYTICS リボンに移動します。Data Manager を開きます。
  2. データソースとして Database を選択します。
  3. Set Connection セクションで、新しいデータベースを作成するオプションをクリックします。
  4. データソースとして Microsoft ODBC Data Source を選択し、OK をクリックします。
  5. ドロップダウンメニューから、先ほど設定した DSN を選択します。
  6. Set Connection セクションに戻り、SQL Builder Provider として Standard (ANSI ODBC) Query Builder を選択して Next をクリックします。
  7. Schema/Owner を選択し、Clear Analytics で使用するドメイン(テーブル)を選択します。
  8. 必要に応じて、テーブルやカラムの表示名と説明をカスタマイズしてデータオブジェクトを準備します。
  9. CData ODBC ドライバーの大半では、ドメインにキー日付を設定する必要はありません。
  10. Domain Relations セクションで、テーブル間のリレーション情報を追加します。
  11. Domain Tree セクションで、データのグループを作成し、利用可能な項目をグループに追加します。
  12. データのサマリーを確認し、Finish をクリックします。

Databricks のデータでチャートを作成

これでDatabricks のデータ を使ったチャートを作成する準備ができました。

新規クエリの作成

  1. CLEAR ANALYTICS リボンの Repository をクリックします。
  2. 新しいクエリを作成します。
  3. 取得するカラムを選択します。
  4. データの集計タイプを設定します(データを集計しない場合は空白のエントリを使用します)。
  5. カラムを下のウィンドウにドラッグして、フィルタと数式を設定します。
  6. クエリに名前を付けて Save をクリックします。

クエリレポートに基づいてチャートを作成

クエリを作成したら、レポートを実行してチャートを表示する準備ができました。
  1. CLEAR ANALYTICS リボンの Report Explorer をクリックします。
  2. Report Explorer ペインで、ツールバーの「New Report」アイコンをクリックします。
  3. 先ほど作成したクエリを選択します。
  4. レポートに名前を付けて「Save and Execute」をクリックします。
  5. Report Explorer 内の Results タブをクリックします。
  6. レポートを展開し、チャートを Excel スプレッドシートにドラッグします。
  7. 表示される PivotChart ウィンドウで、フィールド(カラム)を Filters、Legends、Axis (Categories)、Values ウィンドウにドラッグします。

Clear Analytics で新しいデータソースを確立し、チャートを作成したら、Databricks のデータ の分析を始める準備ができました。ODBC Driver for Databricks と Clear Analytics を使用すると、Databricks からのライブデータを使って Excel でセルフサービス分析を実行できます。

はじめる準備はできましたか?

Databricks ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Databricks Icon Databricks ODBC Driver お問い合わせ

Databricks ODBC Driver は、ODBC 接続をサポートする各種ツールからDatabricks へのシームレスな連携を実現します。

Databricks に使い慣れたデータベースのように標準ODBC インターフェースで読み書き。