MicroStrategy Desktop で CData ODBC Driver for Databricks を使用
MicroStrategy は、データドリブンなイノベーションを可能にする分析およびモビリティプラットフォームです。CData ODBC Driver for Databricks と組み合わせることで、MicroStrategy からリアルタイムのDatabricks のデータにデータベースのようにアクセスでき、レポートや分析の機能を拡張できます。本記事では、MicroStrategy Desktop で Databricks をデータソースとして追加し、Databricks のデータ の簡単なビジュアライゼーションを作成する手順を説明します。
CData ODBC Driver は、ドライバーに組み込まれた最適化されたデータ処理により、MicroStrategy でリアルタイムのDatabricks のデータを操作する際に比類のないパフォーマンスを発揮します。MicroStrategy から Databricks に複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を Databricks に直接プッシュし、サポートされていない操作(多くの場合 SQL 関数や JOIN 操作)は組み込みの SQL エンジンを使用してクライアント側で処理します。動的なメタデータクエリ機能が組み込まれているため、ネイティブの MicroStrategy データ型を使用してDatabricks のデータを可視化・分析できます。
Databricks データ連携について
CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
- あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
- パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
- Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。
多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。
一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases
はじめに
ODBC データソースとして Databricks に接続
Databricks への接続に関する情報と、Windows および Linux 環境での DSN 設定手順を以下に説明します。
Databricks 接続プロパティの取得・設定方法
Databricks クラスターに接続するには、以下のプロパティを設定します。
- Database:Databricks データベース名。
- Server:Databricks クラスターのサーバーのホスト名。
- HTTPPath:Databricks クラスターのHTTP パス。
- Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks への認証
CData は、次の認証スキームをサポートしています。
- 個人用アクセストークン
- Microsoft Entra ID(Azure AD)
- Azure サービスプリンシパル
- OAuthU2M
- OAuthM2M
個人用アクセストークン
認証するには、次を設定します。
- AuthScheme:PersonalAccessToken。
- Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。
DSN を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数を制限でき、レポートやビジュアライゼーションを設計する際のパフォーマンス向上に特に効果的です。
Windows
まだ設定していない場合は、ODBC DSN(データソース名)で接続プロパティを指定してください。これはドライバーインストールの最後のステップです。Microsoft ODBC データソースアドミニストレーターを使用して ODBC DSN を作成・設定できます。
Linux
Linux 環境で CData ODBC Driver for Databricks をインストールする場合、ドライバーのインストール時にシステム DSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini)を編集して、必要な接続プロパティを定義することで DSN を変更できます。
/etc/odbc.ini
[CData Databricks Sys] Driver = CData ODBC Driver for Databricks Description = My Description Server = 127.0.0.1 HTTPPath = MyHTTPPath User = MyUser Token = MyToken
これらの設定ファイルの使用方法の詳細については、ヘルプドキュメント(インストール版およびオンライン版)を参照してください。
MicroStrategy Desktop を使用して Databricks のデータに接続して可視化
MicroStrategy エンタープライズ製品で Databricks に接続するだけでなく、MicroStrategy Desktop でも Databricks に接続できます。以下の手順に従って、Databricks のデータ をデータセットとして追加し、Databricks のデータ のビジュアライゼーションとレポートを作成してください。
- MicroStrategy Desktop を開き、新しいドシエを作成します。
- データセットパネルで「New Data」をクリックし、「Databases」を選択して、インポートオプションとして「Type a Query」を選択します。
- 新しいデータソースを追加し、「DSN data sources」を選択します。
- 以前に設定した DSN(通常は CData Databricks Sys)を選択し、Version メニューで「Generic DBMS」を選択します。
- DSN の User と Password プロパティを設定し(またはプレースホルダー値を使用)、データソースに名前を付けます。
- 新しいデータベースインスタンスを選択してテーブルを表示します。「Available Tables」セクションでテーブルを表示するには、検索アイコンを手動でクリックする必要がある場合があります。
- Databricks のデータ 用の SQL クエリを作成し(以下を参照)、「Execute SQL」をクリックしてクエリをテストします。
SELECT * FROM Customers
注意:ライブ接続を作成するため、SELECT * クエリを実行し、MicroStrategy 製品にネイティブのフィルタリングや集計機能を利用できます。 - 「Finish」をクリックし、ライブ接続を選択します。
- ビジュアライゼーションを選択し、表示するフィールドを選択し(データ型は動的メタデータ検出により自動的に検出されます)、フィルタを適用してDatabricks のデータの新しいビジュアライゼーションを作成します。可能な場合、フィルタや集計によって生成された複雑なクエリは Databricks にプッシュダウンされ、サポートされていない操作(SQL 関数や JOIN 操作を含む場合があります)はドライバーに組み込まれた CData SQL エンジンによってクライアント側で管理されます。

- ドシエの設定が完了したら、「File -> Save」をクリックします。
MicroStrategy Desktop で CData ODBC Driver for Databricks を使用すると、Databricks のデータ の堅牢なビジュアライゼーションとレポートを簡単に作成できます。その他の例については、MicroStrategy で Databricks に接続や MicroStrategy Web で Databricks に接続に関する記事もご覧ください。