MicroStrategy Desktop で CData ODBC Driver for Hive を使用

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
CData ODBC Driver for Hive を使用して MicroStrategy Desktop でHive のデータに接続する方法を紹介します。

MicroStrategy は、データドリブンなイノベーションを可能にする分析およびモビリティプラットフォームです。CData ODBC Driver for Hive と組み合わせることで、MicroStrategy からリアルタイムのHive のデータにデータベースのようにアクセスでき、レポートや分析の機能を拡張できます。本記事では、MicroStrategy Desktop で Hive をデータソースとして追加し、Hive のデータ の簡単なビジュアライゼーションを作成する手順を説明します。

CData ODBC Driver は、ドライバーに組み込まれた最適化されたデータ処理により、MicroStrategy でリアルタイムのHive のデータを操作する際に比類のないパフォーマンスを発揮します。MicroStrategy から Hive に複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を Hive に直接プッシュし、サポートされていない操作(多くの場合 SQL 関数や JOIN 操作)は組み込みの SQL エンジンを使用してクライアント側で処理します。動的なメタデータクエリ機能が組み込まれているため、ネイティブの MicroStrategy データ型を使用してHive のデータを可視化・分析できます。

ODBC データソースとして Hive に接続

Hive への接続に関する情報と、Windows および Linux 環境での DSN 設定手順を以下に説明します。

Apache Hive への接続を確立するには以下を指定します。

  • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:HiveServer2 インスタンスへの接続用のポートに設定。
  • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
  • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

DSN を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数を制限でき、レポートやビジュアライゼーションを設計する際のパフォーマンス向上に特に効果的です。

Windows

まだ設定していない場合は、ODBC DSN(データソース名)で接続プロパティを指定してください。これはドライバーインストールの最後のステップです。Microsoft ODBC データソースアドミニストレーターを使用して ODBC DSN を作成・設定できます。

Linux

Linux 環境で CData ODBC Driver for Hive をインストールする場合、ドライバーのインストール時にシステム DSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini)を編集して、必要な接続プロパティを定義することで DSN を変更できます。

/etc/odbc.ini

[CData ApacheHive Sys]
Driver = CData ODBC Driver for Hive
Description = My Description
Server = 127.0.0.1
Port = 10000
TransportMode = BINARY

これらの設定ファイルの使用方法の詳細については、ヘルプドキュメント(インストール版およびオンライン版)を参照してください。

MicroStrategy Desktop を使用して Hive のデータに接続して可視化

MicroStrategy エンタープライズ製品で Hive に接続するだけでなく、MicroStrategy Desktop でも Hive に接続できます。以下の手順に従って、Hive のデータ をデータセットとして追加し、Hive のデータ のビジュアライゼーションとレポートを作成してください。

  1. MicroStrategy Desktop を開き、新しいドシエを作成します。
  2. データセットパネルで「New Data」をクリックし、「Databases」を選択して、インポートオプションとして「Type a Query」を選択します。
  3. 新しいデータソースを追加し、「DSN data sources」を選択します。
  4. 以前に設定した DSN(通常は CData ApacheHive Sys)を選択し、Version メニューで「Generic DBMS」を選択します。
  5. DSN の User と Password プロパティを設定し(またはプレースホルダー値を使用)、データソースに名前を付けます。
  6. 新しいデータベースインスタンスを選択してテーブルを表示します。「Available Tables」セクションでテーブルを表示するには、検索アイコンを手動でクリックする必要がある場合があります。
  7. Hive のデータ 用の SQL クエリを作成し(以下を参照)、「Execute SQL」をクリックしてクエリをテストします。
    SELECT * FROM Customers
    
    注意:ライブ接続を作成するため、SELECT * クエリを実行し、MicroStrategy 製品にネイティブのフィルタリングや集計機能を利用できます。
  8. 「Finish」をクリックし、ライブ接続を選択します。
  9. ビジュアライゼーションを選択し、表示するフィールドを選択し(データ型は動的メタデータ検出により自動的に検出されます)、フィルタを適用してHive のデータの新しいビジュアライゼーションを作成します。可能な場合、フィルタや集計によって生成された複雑なクエリは Hive にプッシュダウンされ、サポートされていない操作(SQL 関数や JOIN 操作を含む場合があります)はドライバーに組み込まれた CData SQL エンジンによってクライアント側で管理されます。
  10. ドシエの設定が完了したら、「File -> Save」をクリックします。

MicroStrategy Desktop で CData ODBC Driver for Hive を使用すると、Hive のデータ の堅牢なビジュアライゼーションとレポートを簡単に作成できます。その他の例については、MicroStrategy で Hive に接続MicroStrategy Web で Hive に接続に関する記事もご覧ください。

はじめる準備はできましたか?

Apache Hive ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Hive Icon Apache Hive ODBC Driver お問い合わせ

Hive ODBC Driver は、ODBC 接続をサポートする任意のアプリケーションからApache Hive データに直接接続できるパワフルなツールです。

ドライバーはSQL をHiveQL にマッピングして、標準SQL-92 で直接Apache Hive にアクセスできます。