Infragistics Reveal でDatabricks のデータを分析

杉本和也
杉本和也
リードエンジニア
CData Connect AI を使用してDatabricks のデータのOData API を作成し、Infragistics Reveal でDatabricks のデータをリアルタイムでビジュアライズします。

Reveal はInfragistics が提供するデータビジュアライゼーションツールであり、CData Connect AI と組み合わせることでDatabricks のデータから動的なダッシュボードを構築できます。CData Connect AI は、Databricks へのリアルタイム接続を作成し、Databricks のOData API(Reveal でネイティブにサポート)を生成するために使用できます。この記事では、Connect AI でのDatabricks への接続と、Infragistics Reveal からのConnect AI への接続について説明し、簡単なダッシュボードを作成します。

Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


Connect AI を構成する

Infragistics Reveal でDatabricks のデータをリアルタイムで操作するには、Connect AI からDatabricks に接続し、コネクションにユーザーアクセスを提供してDatabricks のデータのOData エンドポイントを作成する必要があります。

(オプション)新しいConnect AI ユーザーの追加

必要であれば、Connect AI 経由でDatabricks に接続するユーザーを作成します。

  1. ユーザーページに移動し、 Invite Users をクリックします。
  2. 新しいユーザーのE メールアドレスを入力して、 Send to invite the user をクリックします。 新しいユーザーを招待
  3. ユーザーページからユーザーを確認および編集できます。 Connect AI users

パーソナルアクセストークンの追加

OAuth 認証をサポートしていないサービス、アプリケーション、プラットフォーム、またはフレームワークから接続する場合は、認証に使用するパーソナルアクセストークン(PAT)を作成できます。きめ細かなアクセス管理を行うために、サービスごとに個別のPAT を作成するのがベストプラクティスです。

  1. Connect AI アプリの右上にあるユーザー名をクリックし、User Profile をクリックします。
  2. User Profile ページで、Personal Access Tokens セクションまでスクロールし、Create PAT をクリックします。
  3. PAT に名前を付け、Create をクリックします。 Creating a new PAT
  4. パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。

Connect AI からDatabricks に接続

CData Connect AI では、簡単なクリック操作ベースのインターフェースでデータソースに接続できます。

  1. Connect AI にログインし、 Add Connection をクリックします。 Adding a Connection
  2. Add Connection パネルから「Databricks」を選択します。 Selecting a data source
  3. 必要な認証プロパティを入力し、Databricks に接続します。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • 個人用アクセストークン
    • Microsoft Entra ID(Azure AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    個人用アクセストークン

    認証するには、次を設定します。

    • AuthSchemePersonalAccessToken
    • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

    Configuring a connection (Salesforce is shown)
  4. Create & Test をクリックします。
  5. Edit Databricks Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。 権限を更新

Connect AI にDatabricks OData エンドポイントを追加する

Databricks に接続したら、目的のテーブルのOData エンドポイントを作成します。

  1. OData ページに移動し、 Add to create new OData endpoints をクリックします。
  2. Databricks コネクション(例:Databricks1)を選択し、Next をクリックします。
  3. 使用するテーブルを選択し、Confirm をクリックします。 テーブルを選択(Salesforce の例)

コネクションとOData エンドポイントが構成されたら、Infragistics Reveal からDatabricks に接続できるようになります。

Reveal でダッシュボードを作成

Connect AI を構成すると、Reveal でDatabricks のデータをビジュアライズできます。

  1. Reveal にログインし、Dashboards -> New とクリックします。 Adding a new dashboard
  2. Data Sources -> OData Feed とクリックします。 Adding a new OData data source
  3. (OData ページにある)Connect AI OData API エンドポイントURL を指定します:https://cloud.cdata.com/api/odata/service Configuring the OData URL
  4. Generic Credentials を選択し、
    • Username をConnect AI のユーザー名に設定します。(user@mydomain.com)
    • Password をユーザーのPAT に設定します。
    Configuring the credentials
  5. ビジュアライズするエンティティを選択します。 Selecting an entity to visualize (Salesforce is shown.)
  6. フィールドを選択し、チャートの種類を選択します。 Visualizing data in Reveal (Salesforce is shown.)

詳細と無料トライアル

これで、リアルタイムDatabricks のデータから簡単なダッシュボードが作成できました。Databricks(および100を超えるほかのデータソース)からのOData フィードの作成方法の詳細については、Connect AI ページにアクセスしてください。無償トライアルにサインアップしてOData API を使用するツールでリアルタイムDatabricks のデータを分析しましょう。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ