MicroStrategy Desktop で CData ODBC Driver for Databricks を使用

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
CData ODBC Driver for Databricks を使用して MicroStrategy Desktop でDatabricks のデータに接続する方法を紹介します。

MicroStrategy は、データドリブンなイノベーションを可能にする分析およびモビリティプラットフォームです。CData ODBC Driver for Databricks と組み合わせることで、MicroStrategy からリアルタイムのDatabricks のデータにデータベースのようにアクセスでき、レポートや分析の機能を拡張できます。本記事では、MicroStrategy Desktop で Databricks をデータソースとして追加し、Databricks のデータ の簡単なビジュアライゼーションを作成する手順を説明します。

CData ODBC Driver は、ドライバーに組み込まれた最適化されたデータ処理により、MicroStrategy でリアルタイムのDatabricks のデータを操作する際に比類のないパフォーマンスを発揮します。MicroStrategy から Databricks に複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を Databricks に直接プッシュし、サポートされていない操作(多くの場合 SQL 関数や JOIN 操作)は組み込みの SQL エンジンを使用してクライアント側で処理します。動的なメタデータクエリ機能が組み込まれているため、ネイティブの MicroStrategy データ型を使用してDatabricks のデータを可視化・分析できます。

Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


ODBC データソースとして Databricks に接続

Databricks への接続に関する情報と、Windows および Linux 環境での DSN 設定手順を以下に説明します。

Databricks 接続プロパティの取得・設定方法

Databricks クラスターに接続するには、以下のプロパティを設定します。

  • Database:Databricks データベース名。
  • Server:Databricks クラスターのサーバーのホスト名
  • HTTPPath:Databricks クラスターのHTTP パス。
  • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

Databricks への認証

CData は、次の認証スキームをサポートしています。

  • 個人用アクセストークン
  • Microsoft Entra ID(Azure AD)
  • Azure サービスプリンシパル
  • OAuthU2M
  • OAuthM2M

個人用アクセストークン

認証するには、次を設定します。

  • AuthSchemePersonalAccessToken
  • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

DSN を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数を制限でき、レポートやビジュアライゼーションを設計する際のパフォーマンス向上に特に効果的です。

Windows

まだ設定していない場合は、ODBC DSN(データソース名)で接続プロパティを指定してください。これはドライバーインストールの最後のステップです。Microsoft ODBC データソースアドミニストレーターを使用して ODBC DSN を作成・設定できます。

Linux

Linux 環境で CData ODBC Driver for Databricks をインストールする場合、ドライバーのインストール時にシステム DSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini)を編集して、必要な接続プロパティを定義することで DSN を変更できます。

/etc/odbc.ini

[CData Databricks Sys]
Driver = CData ODBC Driver for Databricks
Description = My Description
Server = 127.0.0.1
HTTPPath = MyHTTPPath
User = MyUser
Token = MyToken

これらの設定ファイルの使用方法の詳細については、ヘルプドキュメント(インストール版およびオンライン版)を参照してください。

MicroStrategy Desktop を使用して Databricks のデータに接続して可視化

MicroStrategy エンタープライズ製品で Databricks に接続するだけでなく、MicroStrategy Desktop でも Databricks に接続できます。以下の手順に従って、Databricks のデータ をデータセットとして追加し、Databricks のデータ のビジュアライゼーションとレポートを作成してください。

  1. MicroStrategy Desktop を開き、新しいドシエを作成します。
  2. データセットパネルで「New Data」をクリックし、「Databases」を選択して、インポートオプションとして「Type a Query」を選択します。
  3. 新しいデータソースを追加し、「DSN data sources」を選択します。
  4. 以前に設定した DSN(通常は CData Databricks Sys)を選択し、Version メニューで「Generic DBMS」を選択します。
  5. DSN の User と Password プロパティを設定し(またはプレースホルダー値を使用)、データソースに名前を付けます。
  6. 新しいデータベースインスタンスを選択してテーブルを表示します。「Available Tables」セクションでテーブルを表示するには、検索アイコンを手動でクリックする必要がある場合があります。
  7. Databricks のデータ 用の SQL クエリを作成し(以下を参照)、「Execute SQL」をクリックしてクエリをテストします。
    SELECT * FROM Customers
    
    注意:ライブ接続を作成するため、SELECT * クエリを実行し、MicroStrategy 製品にネイティブのフィルタリングや集計機能を利用できます。
  8. 「Finish」をクリックし、ライブ接続を選択します。
  9. ビジュアライゼーションを選択し、表示するフィールドを選択し(データ型は動的メタデータ検出により自動的に検出されます)、フィルタを適用してDatabricks のデータの新しいビジュアライゼーションを作成します。可能な場合、フィルタや集計によって生成された複雑なクエリは Databricks にプッシュダウンされ、サポートされていない操作(SQL 関数や JOIN 操作を含む場合があります)はドライバーに組み込まれた CData SQL エンジンによってクライアント側で管理されます。
  10. ドシエの設定が完了したら、「File -> Save」をクリックします。

MicroStrategy Desktop で CData ODBC Driver for Databricks を使用すると、Databricks のデータ の堅牢なビジュアライゼーションとレポートを簡単に作成できます。その他の例については、MicroStrategy で Databricks に接続MicroStrategy Web で Databricks に接続に関する記事もご覧ください。

はじめる準備はできましたか?

Databricks ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Databricks Icon Databricks ODBC Driver お問い合わせ

Databricks ODBC Driver は、ODBC 接続をサポートする各種ツールからDatabricks へのシームレスな連携を実現します。

Databricks に使い慣れたデータベースのように標準ODBC インターフェースで読み書き。