OBIEE での Hive レポーティングとスタースキーマ
CData ODBC Driver for Hive は、データウェアハウスや直接レポーティングツールにHive のデータへのリアルタイムアクセスを統合できる標準的なデータベースドライバーです。本記事では、データウェアハウスをバイパスして、Oracle Business Intelligence Enterprise Edition(OBIEE)に運用中のHive のデータをインポートする方法を説明します。
Informatica PowerCenter などの ETL ツールとの ODBC 連携については、Knowledge Base を参照してください。Oracle Warehouse Builder への ETL ソリューションについては、Oracle ODBC Gateway とドライバーを使用して「Hive のデータにリモート Oracle データベースとしてアクセス」してください。
ODBC データソースとして Hive に接続
まだ設定していない場合は、ODBC DSN(データソース名)で接続プロパティを指定してください。これはドライバーインストールの最後のステップです。Microsoft ODBC データソースアドミニストレーターを使用して ODBC DSN を作成・設定できます。
Apache Hive への接続を確立するには以下を指定します。
- Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
- Port:HiveServer2 インスタンスへの接続用のポートに設定。
- TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
- CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します
DSN を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数を制限でき、レポートやビジュアライゼーションを設計する際のパフォーマンス向上に特に効果的です。
Hive のメタデータをインポート
以下の手順に従って、OBIEE クライアントツールを使用して Hive のメタデータを OBIEE リポジトリにインポートしてください。その後、Hive のデータ をビジネスモデルに統合できます。
Administration Tool を開き、「File -> New Repository」をクリックします。
- Connection Type メニューで「ODBC 3.5」を選択し、CData DSN を選択します。
- Relational Sources オプションでインポートするメタデータタイプを選択し、Hive のテーブルを選択します。