Pentaho Report Designer でHive のデータを連携利用

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Pentaho BI ツールでHive のデータをもとにしたレポートを公開。

CData JDBC Driver for Hive のデータ を使えば、ダッシュボードやレポートからリアルタイムデータにアクセスできます。この記事では、Hive のデータにJDBC データソースとして接続し、Pentaho でHive のデータをもとにしたレポートを公開する方法を説明します。

接続してレポートを作成

  1. インストールディレクトリのlib サブフォルダ内にあるドライバーのJAR ファイルを、Pentaho ディレクトリ内の\Report-Designer\lib\jdbc\ フォルダにコピーします。
  2. \Report-Designer\ フォルダ内のreport-designer.bat ファイルを実行してReport-Designer UI を開きます。
  3. Data -> Add Data Source -> Advanced -> JDBC(Custom)をクリックし、新しいHive 接続を作成して、ドライバーで新しいデータソースを作成します。 表示されるダイアログで、以下のように接続プロパティを設定します。

    • Custom Connection URL property:JDBC URL を入力します。JDBC URL はjdbc:apachehive: で始まり、その後にセミコロン区切りで接続プロパティを指定します。

      Apache Hive への接続を確立するには以下を指定します。

      • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
      • Port:HiveServer2 インスタンスへの接続用のポートに設定。
      • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
      • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
      • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

      組み込みの接続文字列デザイナー

      JDBC URL の構成については、Hive JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインからJAR ファイルを実行します。

      java -jar cdata.jdbc.apachehive.jar
      

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      JDBC URL を設定する際、Max Rows 接続プロパティの設定も検討してください。これにより返される行数が制限されます。特にレポートやビジュアライゼーションを設計する際のパフォーマンス向上に役立ちます。

      一般的なJDBC URL は次のとおりです:

      jdbc:apachehive:Server=127.0.0.1;Port=10000;TransportMode=BINARY;
    • Custom Driver Class Name:cdata.jdbc.apachehive.ApacheHiveDriver を入力します。
    • User Name:認証に使用するユーザー名。
    • Password:認証に使用するパスワード。

レポートにHive のデータを追加

Hive のデータをもとにレポートを作成する準備が整いました。

  1. レポートにHive のソースを追加します。Data -> Add Data Source -> JDBC をクリックしてデータソースを選択します。

  2. クエリを設定します。この記事では以下のクエリを使用します:

    SELECT City, CompanyName FROM Customers
  3. レポートにチャートをドラッグし、ダブルクリックしてチャートを編集します。レポートを実行してチャートを表示します。このクエリの結果を使用して、Customers テーブルのシンプルなチャートを作成できます。
  4. 最後に、レポートを実行してチャートを確認します。

はじめる準備はできましたか?

Apache Hive Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Hive Icon Apache Hive JDBC Driver お問い合わせ

Apache Hive 互換ディストリビューション連携のパワフルなJava アプリケーションを素早く作成して配布。