Amazon QuickSight でDatabricks のデータからインタラクティブなダッシュボードを作成する

加藤龍彦
加藤龍彦
デジタルマーケティング
CData Connect AI でDatabricks へのコネクションを作成し、Amazon QuickSight SPICE からDatabricks のデータを取得してインタラクティブなダッシュボードを作成します。

Amazon QuickSight ではクラウド上でインタラクティブなダッシュボードを作成できます。CData Connect AI と組み合わせると、ビジュアライゼーションやダッシュボード用にDatabricks のデータにクラウドベースでアクセスできます。この記事では、Connect AI でDatabricks に接続し、Amazon QuickSight でDatabricks のデータにアクセスしダッシュボードを構築する方法を説明します。

Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


Connect AI からDatabricks に接続する

CData Connect AI では、直感的なクリック操作ベースのインターフェースを使ってデータソースに接続できます。
  1. Connect AI にログインし、 Add Connection をクリックします。 Adding a Connection
  2. Add Connection パネルから「Databricks」を選択します。 Selecting a data source
  3. 必要な認証プロパティを入力し、Databricks に接続します。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • 個人用アクセストークン
    • Microsoft Entra ID(Azure AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    個人用アクセストークン

    認証するには、次を設定します。

    • AuthSchemePersonalAccessToken
    • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

    Configuring a connection (Salesforce is shown)
  4. Create & Test をクリックします。
  5. Edit Databricks Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。 権限を更新

パーソナルアクセストークンの追加

OAuth 認証をサポートしていないサービス、アプリケーション、プラットフォーム、またはフレームワークから接続する場合は、認証に使用するパーソナルアクセストークン(PAT)を作成できます。きめ細かなアクセス管理を行うために、サービスごとに個別のPAT を作成するのがベストプラクティスです。

  1. Connect AI アプリの右上にあるユーザー名をクリックし、User Profile をクリックします。
  2. User Profile ページでPersonal Access Token セクションにスクロールし、 Create PAT をクリックします。
  3. PAT の名前を入力して Create をクリックします。 Creating a new PAT
  4. パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。

コネクションが構成されたら、Amazon QuickSight からDatabricks に接続できるようになります。

Databricks のデータをSPICE にインポートしてインタラクティブなダッシュボードを作成する

以下のステップでは、Connect AI のDatabricks 接続をベースにした新しいデータセットの作成、データセットのSPICE へのインポート、およびデータからの簡単なビジュアライゼーションを構築する方法を説明します。

  1. Amazon QuickSight にログインし「データセット」をクリックします。
  2. 「新しいデータセット」をクリックし、データソースとしてSQL Server を選択しConnect AI のインスタンスへの接続を構成します。完了したら「データソースを作成」をクリックします。 Connecting to Connect AI as a QuickSight data set.
  3. ビジュアライズ化したいテーブルを選択するか、データのカスタムSQL クエリを発行します。 Selecting a Table to visualize.
  4. 「データの編集 / プレビュー」をクリックしデータセットをカスタマイズします。
  5. 「迅速な分析のために SPICE へインポート」を選択し「視覚化する」をクリックします。 Importing data to SPICE for quicker analytics.
  6. ビジュアライズしたいフィールドとタイプを選択します。 Visualizing data in QuickSight via Connect AI (Salesforce is shown).

SPICE データセットの更新をスケジュールする

QuickSight のユーザーはSPICE にインポートしたデータセットの更新をスケジュールし、分析されるデータが最新で更新されたものだけであることを確認できます。

  1. QuickSight のホームページへ移動します。
  2. 「データの管理」をクリックします。
  3. 更新したいデータセットを選択します。
  4. 「更新をスケジュール」をクリックします。
  5. 「作成」をクリックし、更新スケジュール(タイムゾーン、繰り返しの頻度、開始日)を設定し、「作成」をクリックします。 Scheduling a refreshing of the data imported into SPICE.

クラウドアプリケーションからDatabricks のデータへのSQL アクセス

これで、Amazon QuickSigh ダッシュボードからDatabricks へ直接クラウドベースで接続できます。新しいビジュアライゼーションを作成したり、インタラクティブなダッシュボードを作成したりすることができます。Amazon QuickSight のようなクラウドアプリケーションで、100 を超えるSaaS、Big Data、NoSQL ソースのデータにライブアクセスする方法の詳細については、Connect AI ページを参照してください。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ