MicroStrategy Desktop で CData ODBC Driver for Spark を使用

Jerod Johnson
Senior Technology Evangelist

CData ODBC Driver for Spark を使用して MicroStrategy Desktop でSpark のデータに接続する方法を紹介します。

MicroStrategy は、データドリブンなイノベーションを可能にする分析およびモビリティプラットフォームです。CData ODBC Driver for Spark と組み合わせることで、MicroStrategy からリアルタイムのSpark のデータにデータベースのようにアクセスでき、レポートや分析の機能を拡張できます。本記事では、MicroStrategy Desktop で Spark をデータソースとして追加し、Spark のデータの簡単なビジュアライゼーションを作成する手順を説明します。

CData ODBC Driver は、ドライバーに組み込まれた最適化されたデータ処理により、MicroStrategy でリアルタイムのSpark のデータを操作する際に比類のないパフォーマンスを発揮します。MicroStrategy から Spark に複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を Spark に直接プッシュし、サポートされていない操作（多くの場合 SQL 関数や JOIN 操作）は組み込みの SQL エンジンを使用してクライアント側で処理します。動的なメタデータクエリ機能が組み込まれているため、ネイティブの MicroStrategy データ型を使用してSpark のデータを可視化・分析できます。

ODBC データソースとして Spark に接続

Spark への接続に関する情報と、Windows および Linux 環境での DSN 設定手順を以下に説明します。

SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。

Server：SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
Port：SparkSQL インスタンスへの接続用のポートに設定。
TransportMode：SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
AuthScheme：使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note：必要な値は、「クラスター」に移動して目的のクラスターを選択し、「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

Server：Databricks クラスターのサーバーのホスト名に設定。
Port：443
TransportMode：HTTP
HTTPPath：Databricks クラスターのHTTP パスに設定。
UseSSL：True
AuthScheme：PLAIN
User：'token' に設定。
Password：パーソナルアクセストークンに設定（値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます）。

DSN を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数を制限でき、レポートやビジュアライゼーションを設計する際のパフォーマンス向上に特に効果的です。

Windows

まだ設定していない場合は、ODBC DSN（データソース名）で接続プロパティを指定してください。これはドライバーインストールの最後のステップです。Microsoft ODBC データソースアドミニストレーターを使用して ODBC DSN を作成・設定できます。

Linux

Linux 環境で CData ODBC Driver for Spark をインストールする場合、ドライバーのインストール時にシステム DSN が事前定義されます。システムデータソースファイル（/etc/odbc.ini）を編集して、必要な接続プロパティを定義することで DSN を変更できます。

/etc/odbc.ini

[CData SparkSQL Sys]
Driver = CData ODBC Driver for Spark
Description = My Description
Server = 127.0.0.1

これらの設定ファイルの使用方法の詳細については、ヘルプドキュメント（インストール版およびオンライン版）を参照してください。

MicroStrategy Desktop を使用して Spark のデータに接続して可視化

MicroStrategy エンタープライズ製品で Spark に接続するだけでなく、MicroStrategy Desktop でも Spark に接続できます。以下の手順に従って、Spark のデータをデータセットとして追加し、Spark のデータのビジュアライゼーションとレポートを作成してください。

MicroStrategy Desktop を開き、新しいドシエを作成します。
データセットパネルで「New Data」をクリックし、「Databases」を選択して、インポートオプションとして「Type a Query」を選択します。
新しいデータソースを追加し、「DSN data sources」を選択します。
以前に設定した DSN（通常は CData SparkSQL Sys）を選択し、Version メニューで「Generic DBMS」を選択します。
DSN の User と Password プロパティを設定し（またはプレースホルダー値を使用）、データソースに名前を付けます。
新しいデータベースインスタンスを選択してテーブルを表示します。「Available Tables」セクションでテーブルを表示するには、検索アイコンを手動でクリックする必要がある場合があります。
Spark のデータ用の SQL クエリを作成し（以下を参照）、「Execute SQL」をクリックしてクエリをテストします。
```
SELECT * FROM Customers
```
注意：ライブ接続を作成するため、SELECT * クエリを実行し、MicroStrategy 製品にネイティブのフィルタリングや集計機能を利用できます。
「Finish」をクリックし、ライブ接続を選択します。
ビジュアライゼーションを選択し、表示するフィールドを選択し（データ型は動的メタデータ検出により自動的に検出されます）、フィルタを適用してSpark のデータの新しいビジュアライゼーションを作成します。可能な場合、フィルタや集計によって生成された複雑なクエリは Spark にプッシュダウンされ、サポートされていない操作（SQL 関数や JOIN 操作を含む場合があります）はドライバーに組み込まれた CData SQL エンジンによってクライアント側で管理されます。
ドシエの設定が完了したら、「File -> Save」をクリックします。

MicroStrategy Desktop で CData ODBC Driver for Spark を使用すると、Spark のデータの堅牢なビジュアライゼーションとレポートを簡単に作成できます。その他の例については、MicroStrategy で Spark に接続や MicroStrategy Web で Spark に接続に関する記事もご覧ください。