MicroStrategy Desktop で CData ODBC Driver for HDFS を使用
MicroStrategy は、データドリブンなイノベーションを可能にする分析およびモビリティプラットフォームです。CData ODBC Driver for HDFS と組み合わせることで、MicroStrategy からリアルタイムのHDFS のデータにデータベースのようにアクセスでき、レポートや分析の機能を拡張できます。本記事では、MicroStrategy Desktop で HDFS をデータソースとして追加し、HDFS のデータ の簡単なビジュアライゼーションを作成する手順を説明します。
CData ODBC Driver は、ドライバーに組み込まれた最適化されたデータ処理により、MicroStrategy でリアルタイムのHDFS のデータを操作する際に比類のないパフォーマンスを発揮します。MicroStrategy から HDFS に複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を HDFS に直接プッシュし、サポートされていない操作(多くの場合 SQL 関数や JOIN 操作)は組み込みの SQL エンジンを使用してクライアント側で処理します。動的なメタデータクエリ機能が組み込まれているため、ネイティブの MicroStrategy データ型を使用してHDFS のデータを可視化・分析できます。
ODBC データソースとして HDFS に接続
HDFS への接続に関する情報と、Windows および Linux 環境での DSN 設定手順を以下に説明します。
HDFS 接続プロパティの取得・設定方法
HDFS への認証には、次の接続プロパティを設定します。
- Host:HDFS インスタンスのホストに設定。
- Port:HDFS インスタンスのポートに設定。デフォルトのポートは"9870" です。
DSN を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数を制限でき、レポートやビジュアライゼーションを設計する際のパフォーマンス向上に特に効果的です。
Windows
まだ設定していない場合は、ODBC DSN(データソース名)で接続プロパティを指定してください。これはドライバーインストールの最後のステップです。Microsoft ODBC データソースアドミニストレーターを使用して ODBC DSN を作成・設定できます。
Linux
Linux 環境で CData ODBC Driver for HDFS をインストールする場合、ドライバーのインストール時にシステム DSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini)を編集して、必要な接続プロパティを定義することで DSN を変更できます。
/etc/odbc.ini
[CData HDFS Sys] Driver = CData ODBC Driver for HDFS Description = My Description Host = sandbox-hdp.hortonworks.com Port = 50070 Path = /user/root User = root
これらの設定ファイルの使用方法の詳細については、ヘルプドキュメント(インストール版およびオンライン版)を参照してください。
MicroStrategy Desktop を使用して HDFS のデータに接続して可視化
MicroStrategy エンタープライズ製品で HDFS に接続するだけでなく、MicroStrategy Desktop でも HDFS に接続できます。以下の手順に従って、HDFS のデータ をデータセットとして追加し、HDFS のデータ のビジュアライゼーションとレポートを作成してください。
- MicroStrategy Desktop を開き、新しいドシエを作成します。
- データセットパネルで「New Data」をクリックし、「Databases」を選択して、インポートオプションとして「Type a Query」を選択します。
- 新しいデータソースを追加し、「DSN data sources」を選択します。
- 以前に設定した DSN(通常は CData HDFS Sys)を選択し、Version メニューで「Generic DBMS」を選択します。
- DSN の User と Password プロパティを設定し(またはプレースホルダー値を使用)、データソースに名前を付けます。
- 新しいデータベースインスタンスを選択してテーブルを表示します。「Available Tables」セクションでテーブルを表示するには、検索アイコンを手動でクリックする必要がある場合があります。
- HDFS のデータ 用の SQL クエリを作成し(以下を参照)、「Execute SQL」をクリックしてクエリをテストします。
SELECT * FROM Files
注意:ライブ接続を作成するため、SELECT * クエリを実行し、MicroStrategy 製品にネイティブのフィルタリングや集計機能を利用できます。 - 「Finish」をクリックし、ライブ接続を選択します。
- ビジュアライゼーションを選択し、表示するフィールドを選択し(データ型は動的メタデータ検出により自動的に検出されます)、フィルタを適用してHDFS のデータの新しいビジュアライゼーションを作成します。可能な場合、フィルタや集計によって生成された複雑なクエリは HDFS にプッシュダウンされ、サポートされていない操作(SQL 関数や JOIN 操作を含む場合があります)はドライバーに組み込まれた CData SQL エンジンによってクライアント側で管理されます。

- ドシエの設定が完了したら、「File -> Save」をクリックします。
MicroStrategy Desktop で CData ODBC Driver for HDFS を使用すると、HDFS のデータ の堅牢なビジュアライゼーションとレポートを簡単に作成できます。その他の例については、MicroStrategy で HDFS に接続や MicroStrategy Web で HDFS に接続に関する記事もご覧ください。