MicroStrategy Desktop で CData ODBC Driver for Spark を使用
MicroStrategy は、データドリブンなイノベーションを可能にする分析およびモビリティプラットフォームです。CData ODBC Driver for Spark と組み合わせることで、MicroStrategy からリアルタイムのSpark のデータにデータベースのようにアクセスでき、レポートや分析の機能を拡張できます。本記事では、MicroStrategy Desktop で Spark をデータソースとして追加し、Spark のデータ の簡単なビジュアライゼーションを作成する手順を説明します。
CData ODBC Driver は、ドライバーに組み込まれた最適化されたデータ処理により、MicroStrategy でリアルタイムのSpark のデータを操作する際に比類のないパフォーマンスを発揮します。MicroStrategy から Spark に複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を Spark に直接プッシュし、サポートされていない操作(多くの場合 SQL 関数や JOIN 操作)は組み込みの SQL エンジンを使用してクライアント側で処理します。動的なメタデータクエリ機能が組み込まれているため、ネイティブの MicroStrategy データ型を使用してSpark のデータを可視化・分析できます。
ODBC データソースとして Spark に接続
Spark への接続に関する情報と、Windows および Linux 環境での DSN 設定手順を以下に説明します。
SparkSQL への接続
SparkSQL への接続を確立するには以下を指定します。
- Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
- Port:SparkSQL インスタンスへの接続用のポートに設定。
- TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
Databricks への接続
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
- Server:Databricks クラスターのサーバーのホスト名に設定。
- Port:443
- TransportMode:HTTP
- HTTPPath:Databricks クラスターのHTTP パスに設定。
- UseSSL:True
- AuthScheme:PLAIN
- User:'token' に設定。
- Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。
DSN を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数を制限でき、レポートやビジュアライゼーションを設計する際のパフォーマンス向上に特に効果的です。
Windows
まだ設定していない場合は、ODBC DSN(データソース名)で接続プロパティを指定してください。これはドライバーインストールの最後のステップです。Microsoft ODBC データソースアドミニストレーターを使用して ODBC DSN を作成・設定できます。
Linux
Linux 環境で CData ODBC Driver for Spark をインストールする場合、ドライバーのインストール時にシステム DSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini)を編集して、必要な接続プロパティを定義することで DSN を変更できます。
/etc/odbc.ini
[CData SparkSQL Sys] Driver = CData ODBC Driver for Spark Description = My Description Server = 127.0.0.1
これらの設定ファイルの使用方法の詳細については、ヘルプドキュメント(インストール版およびオンライン版)を参照してください。
MicroStrategy Desktop を使用して Spark のデータに接続して可視化
MicroStrategy エンタープライズ製品で Spark に接続するだけでなく、MicroStrategy Desktop でも Spark に接続できます。以下の手順に従って、Spark のデータ をデータセットとして追加し、Spark のデータ のビジュアライゼーションとレポートを作成してください。
- MicroStrategy Desktop を開き、新しいドシエを作成します。
- データセットパネルで「New Data」をクリックし、「Databases」を選択して、インポートオプションとして「Type a Query」を選択します。
- 新しいデータソースを追加し、「DSN data sources」を選択します。
- 以前に設定した DSN(通常は CData SparkSQL Sys)を選択し、Version メニューで「Generic DBMS」を選択します。
- DSN の User と Password プロパティを設定し(またはプレースホルダー値を使用)、データソースに名前を付けます。
- 新しいデータベースインスタンスを選択してテーブルを表示します。「Available Tables」セクションでテーブルを表示するには、検索アイコンを手動でクリックする必要がある場合があります。
- Spark のデータ 用の SQL クエリを作成し(以下を参照)、「Execute SQL」をクリックしてクエリをテストします。
SELECT * FROM Customers
注意:ライブ接続を作成するため、SELECT * クエリを実行し、MicroStrategy 製品にネイティブのフィルタリングや集計機能を利用できます。 - 「Finish」をクリックし、ライブ接続を選択します。
- ビジュアライゼーションを選択し、表示するフィールドを選択し(データ型は動的メタデータ検出により自動的に検出されます)、フィルタを適用してSpark のデータの新しいビジュアライゼーションを作成します。可能な場合、フィルタや集計によって生成された複雑なクエリは Spark にプッシュダウンされ、サポートされていない操作(SQL 関数や JOIN 操作を含む場合があります)はドライバーに組み込まれた CData SQL エンジンによってクライアント側で管理されます。

- ドシエの設定が完了したら、「File -> Save」をクリックします。
MicroStrategy Desktop で CData ODBC Driver for Spark を使用すると、Spark のデータ の堅牢なビジュアライゼーションとレポートを簡単に作成できます。その他の例については、MicroStrategy で Spark に接続や MicroStrategy Web で Spark に接続に関する記事もご覧ください。