Klipfolio でDatabricks に接続し、ビジュアライゼーションを作成
Klipfolio は、チームやクライアント向けのリアルタイムダッシュボードを構築するための、オンラインダッシュボードプラットフォームです。CData Connect AI と組み合わせると、ビジュアライゼーションやレポート用にDatabricks のデータにクラウドベースでアクセスできます。この記事では、Connect AI でDatabricks に接続し、Klipfolio でDatabricks のデータからビジュアライゼーションを構築する方法を説明します。
Databricks データ連携について
CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
- あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
- パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
- Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。
多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。
一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases
はじめに
Connect AI からDatabricks に接続する
CData Connect AI は直感的なクリック操作ベースのインターフェースを使ってデータソースに接続します。- Connect AI にログインし、 Add Connection をクリックします。
- Add Connection パネルから「Databricks」を選択します。
-
必要な認証プロパティを入力し、Databricks に接続します。
Databricks 接続プロパティの取得・設定方法
Databricks クラスターに接続するには、以下のプロパティを設定します。
- Database:Databricks データベース名。
- Server:Databricks クラスターのサーバーのホスト名。
- HTTPPath:Databricks クラスターのHTTP パス。
- Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks への認証
CData は、次の認証スキームをサポートしています。
- 個人用アクセストークン
- Microsoft Entra ID(Azure AD)
- Azure サービスプリンシパル
- OAuthU2M
- OAuthM2M
個人用アクセストークン
認証するには、次を設定します。
- AuthScheme:PersonalAccessToken。
- Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。
- Create & Test をクリックします。
- Add Databricks Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。
パーソナルアクセストークンを追加する
OAuth 認証をサポートしないサービス、アプリケーション、プラットフォーム、フレームワークから接続する場合、パーソナルアクセストークン(Personal Access Token, PAT)を認証に使用できます。きめ細かくアクセスを管理するために、サービスごとに個別のPAT を作成するのがベストプラクティスです。
- Connect AI アプリの右上にあるユーザー名をクリックし、User Profile をクリックします。
- User Profile ページでPersonal Access Token セクションにスクロールし、 Create PAT をクリックします。
- PAT の名前を入力して Create をクリックします。
- パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。
コネクションが構成されたら、Klipfolio に接続できるようになります。
Klipfolio からDatabricks に接続する
以下のステップでは、Klipfolio からCData Connect AI に接続して新しいDatabricks のデータソースを作成する方法の概要を説明します。
- Klipfolio を開きます。
- Data Sources で をクリックして新しいデータソースを追加します。
- MSSQL をService として検索して選択します。
- 「Create a custom MSSQL data source」をクリックします。
- MSSQL 接続プロパティを設定してデータソースを構成します。
- Host:tds.cdata.com
- Port:14333
- Database: データベース (例 Databricks1)
- Driver:MS SQL
- Username:Connect AI ユーザー(例:user@mydomain.com)
- Password:上記のユーザーのPAT
- SQL Query:データを取得するためのクエリ(例:SELECT * FROM Customers)
- 「Include column headers」チェックボックスをオンにします。
- 「Use SSL/TLS」チェックボックスをオンにします。
- データモデルを構築する前に「Get data」をクリックしてDatabricks のデータをプレビューします。
データモデルを構築する
データを取得したら、「Model your data」チェックボックスを選択して「Continue」をクリックします。新しいウィンドウでデータモデルを構築します。
- 使用するすべてのカラムがモデルに含まれていることを確認します。
- モデルに名前を付けます。
- (オプション)Description を設定します。
- 「Header in row」を1に設定します。
- 「Exclude data before row」のトグルをクリックして値を2 に設定します。
- 「Save and Exit」をクリックします。
Metric を作成する
データがモデル化されたことで、ダッシュボードやレポートなどのKlipfolio プラットフォームで使用されるデータのMetric(またはビジュアライゼーション)を作成することができるようになりました。
- 「Create metrics」をクリックします。
- データソースを選択します。
- Metric の値とデフォルトの集計を選択します。
- セグメントを選択します。
- 日時を選択します。
- データのシェイプを選択します。
- 表示設定を構成します。
- Save をクリックします。
- Metric に移動し、ビジュアライゼーションをさらに設定します。
クラウドアプリケーションからDatabricks のデータへのSQL アクセス
これで、リアルタイムDatabricks のデータから作成されたMetric ができました。新しいダッシュボードに追加したり共有したりすることができます。これで、Databricks を複製することなくより多くのデータソースや新しいビジュアライゼーション、レポートを簡単に作成することができます。
クラウドアプリケーションから直接100を超えるSaaS 、ビッグデータ、NoSQL ソースへのSQL データアクセスを取得するには、CData Connect AI をお試しください。