MotionBoard からDatabricks のデータに連携してダッシュボードを作成
MotionBoard は、ウイングアーク1st 社が提供する人気のBI ダッシュボードツールです。この記事ではMotionBoard で、Databricks のデータをCData Connect を通じてシームレスに統合利用する方法を説明します。
CData Connect AI は、SaaS 型のデータ仮想化プラットフォームです。Salesforce、Dynamics、Zoho CRM、NetSuite、Marketo、kintone など150以上の多様なSaaS にBI ツール、アナリティクス、iPaaS、ノーコード開発プラットフォームからアクセスするための仮想エンドポイントを提供します。連携方法が異なるSaaS をSQL Server 、SQL Server、OData の3種類のインターフェースに仮想化することで、データ連携をシンプルに実現します。
この記事では、Databricks のデータを仮想SQL Server エンドポイントして利用してMotionBoard からデータを取得、可視化します。
Databricks データ連携について
CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
- あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
- パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
- Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。
多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。
一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases
はじめに
Connect AI からDatabricks に接続する
CData Connect AI では、直感的なクリック操作ベースのインターフェースを使ってデータソースに接続できます。- Connect AI にログインし、 Add Connection をクリックします。
- Add Connection パネルから「Databricks」を選択します。
-
必要な認証プロパティを入力し、Databricks に接続します。
Databricks 接続プロパティの取得・設定方法
Databricks クラスターに接続するには、以下のプロパティを設定します。
- Database:Databricks データベース名。
- Server:Databricks クラスターのサーバーのホスト名。
- HTTPPath:Databricks クラスターのHTTP パス。
- Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks への認証
CData は、次の認証スキームをサポートしています。
- 個人用アクセストークン
- Microsoft Entra ID(Azure AD)
- Azure サービスプリンシパル
- OAuthU2M
- OAuthM2M
個人用アクセストークン
認証するには、次を設定します。
- AuthScheme:PersonalAccessToken。
- Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。
- Create & Test をクリックします。
パーソナルアクセストークンの追加
MotionBoard への接続には、パスワードの代わりとしてパーソナルアクセストークンを利用します。セキュアなアクセス管理を実現するには、サービスごとに個別のPAT を作成するのがベストプラクティスです。
- Connect AI アプリの右上にある歯車アイコンをクリックします。
- Settings ページで「Access Tokens」タブに移動し、 Create PAT をクリックします。
- PAT の名前を入力して Create をクリックします。
- パーソナルアクセストークンは作成時にしか表示されないため、コピーして安全に保存してください。
MotionBoard からDatabricks のデータに接続してダッシュボードを作成
MotionBoardの「システム設定 → 接続/認証 → 外部接続」から新しい外部接続を作成します。接続先タイプはSQL Server を選択します。
- 外部接続名:任意(例:CDataConnect)
- 接続先タイプ:SQL Server
- 中継サービス:使用しない
外部接続の基本情報タブにて以下内容をセットします。
- 外部接続名:任意(例:CDataConnect)
- 接続先タイプ:SQL Server
- 接続先タイプ:SQL Server 4.0(JDBC)
- 中継サービス:使用しない
- サーバー名:tds.cdata.com
- ポート : 14333
- データベース名 : 先ほどConnect AI で作成した接続先データソース名(例:Databricks1)
- ユーザー名 : Connect AI のユーザー名(メールアドレス)
- パスワード : パーソナルアクセストークン
「データソース」タブを開き、Databricks 内のテーブルが一覧に表示されることを確認できます。ここまで確認できたら「保存」ボタンで外部接続定義を保存して閉じます。
「ボード新規作成」から新しいボードを作成します。
アイテムウィザードのDS1の接続先に上記の外部接続定義で作成した接続(本例では Cdata Connect)を選択します。次に、左側のデータベースにDatabricks のテーブルリストが表示されますので、使用するテーブルを選択します。右側にDealsテーブル内のデータがプレビューされます。
ウィザードを次に進み、作成するアイテムにチャートを選択して、「次へ」をクリックします。データソース エディタが起動します。左側の項目一覧から可視化したい項目を行項目・列項目・集計項目にセットします。もうRDB やCSV などのデータソースを扱う場合と同じ操作でビジュアライズを作成できます。あとは、おすすめチャートから適切なチャート種類を選択します。
まとめ
このように、CData Connect AI を経由することで、API 側の複雑な仕様を意識せずにMotionBoard でデータを可視化できます。他にも多くのデータソースに対応するCData Connect AI の詳細をこちらからご確認ください。