MicroStrategy Desktop で CData ODBC Driver for Spark を使用

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
CData ODBC Driver for Spark を使用して MicroStrategy Desktop でSpark のデータに接続する方法を紹介します。

MicroStrategy は、データドリブンなイノベーションを可能にする分析およびモビリティプラットフォームです。CData ODBC Driver for Spark と組み合わせることで、MicroStrategy からリアルタイムのSpark のデータにデータベースのようにアクセスでき、レポートや分析の機能を拡張できます。本記事では、MicroStrategy Desktop で Spark をデータソースとして追加し、Spark のデータ の簡単なビジュアライゼーションを作成する手順を説明します。

CData ODBC Driver は、ドライバーに組み込まれた最適化されたデータ処理により、MicroStrategy でリアルタイムのSpark のデータを操作する際に比類のないパフォーマンスを発揮します。MicroStrategy から Spark に複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を Spark に直接プッシュし、サポートされていない操作(多くの場合 SQL 関数や JOIN 操作)は組み込みの SQL エンジンを使用してクライアント側で処理します。動的なメタデータクエリ機能が組み込まれているため、ネイティブの MicroStrategy データ型を使用してSpark のデータを可視化・分析できます。

ODBC データソースとして Spark に接続

Spark への接続に関する情報と、Windows および Linux 環境での DSN 設定手順を以下に説明します。

SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。

  • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:SparkSQL インスタンスへの接続用のポートに設定。
  • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

  • Server:Databricks クラスターのサーバーのホスト名に設定。
  • Port:443
  • TransportMode:HTTP
  • HTTPPath:Databricks クラスターのHTTP パスに設定。
  • UseSSL:True
  • AuthScheme:PLAIN
  • User:'token' に設定。
  • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

DSN を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数を制限でき、レポートやビジュアライゼーションを設計する際のパフォーマンス向上に特に効果的です。

Windows

まだ設定していない場合は、ODBC DSN(データソース名)で接続プロパティを指定してください。これはドライバーインストールの最後のステップです。Microsoft ODBC データソースアドミニストレーターを使用して ODBC DSN を作成・設定できます。

Linux

Linux 環境で CData ODBC Driver for Spark をインストールする場合、ドライバーのインストール時にシステム DSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini)を編集して、必要な接続プロパティを定義することで DSN を変更できます。

/etc/odbc.ini

[CData SparkSQL Sys]
Driver = CData ODBC Driver for Spark
Description = My Description
Server = 127.0.0.1

これらの設定ファイルの使用方法の詳細については、ヘルプドキュメント(インストール版およびオンライン版)を参照してください。

MicroStrategy Desktop を使用して Spark のデータに接続して可視化

MicroStrategy エンタープライズ製品で Spark に接続するだけでなく、MicroStrategy Desktop でも Spark に接続できます。以下の手順に従って、Spark のデータ をデータセットとして追加し、Spark のデータ のビジュアライゼーションとレポートを作成してください。

  1. MicroStrategy Desktop を開き、新しいドシエを作成します。
  2. データセットパネルで「New Data」をクリックし、「Databases」を選択して、インポートオプションとして「Type a Query」を選択します。
  3. 新しいデータソースを追加し、「DSN data sources」を選択します。
  4. 以前に設定した DSN(通常は CData SparkSQL Sys)を選択し、Version メニューで「Generic DBMS」を選択します。
  5. DSN の User と Password プロパティを設定し(またはプレースホルダー値を使用)、データソースに名前を付けます。
  6. 新しいデータベースインスタンスを選択してテーブルを表示します。「Available Tables」セクションでテーブルを表示するには、検索アイコンを手動でクリックする必要がある場合があります。
  7. Spark のデータ 用の SQL クエリを作成し(以下を参照)、「Execute SQL」をクリックしてクエリをテストします。
    SELECT * FROM Customers
    
    注意:ライブ接続を作成するため、SELECT * クエリを実行し、MicroStrategy 製品にネイティブのフィルタリングや集計機能を利用できます。
  8. 「Finish」をクリックし、ライブ接続を選択します。
  9. ビジュアライゼーションを選択し、表示するフィールドを選択し(データ型は動的メタデータ検出により自動的に検出されます)、フィルタを適用してSpark のデータの新しいビジュアライゼーションを作成します。可能な場合、フィルタや集計によって生成された複雑なクエリは Spark にプッシュダウンされ、サポートされていない操作(SQL 関数や JOIN 操作を含む場合があります)はドライバーに組み込まれた CData SQL エンジンによってクライアント側で管理されます。
  10. ドシエの設定が完了したら、「File -> Save」をクリックします。

MicroStrategy Desktop で CData ODBC Driver for Spark を使用すると、Spark のデータ の堅牢なビジュアライゼーションとレポートを簡単に作成できます。その他の例については、MicroStrategy で Spark に接続MicroStrategy Web で Spark に接続に関する記事もご覧ください。

はじめる準備はできましたか?

Apache Spark ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Spark Icon Apache Spark ODBC Driver お問い合わせ

Apache Spark ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからApache Spark データへの接続を実現するパワフルなツールです。

標準SQL とSpark SQL をマッピングして、SQL-92 で直接Apache Spark にアクセス。