JReport Designer で Hive ののデータを連携利用

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
JReport Designer で Hive のデータ をもとにチャートとレポートを作成。

CData JDBC Driver for Hive のデータ を使えば、ダッシュボードやレポートから Hive をリレーショナルデータベースのように扱い、使い慣れた SQL クエリで Hive のデータ のライブデータにアクセスできます。この記事では、JReport Designer で Hive のデータ に JDBC データソースとして接続し、Hive のデータ のデータをもとにレポートを作成する方法を説明します。

Hive ののデータに接続

  1. C:\JReport\Designer\bin\setenv.bat を編集して、JAR ファイルの場所を ADDCLASSPATH 変数に追加します。
    ...
    set ADDCLASSPATH=%JAVAHOME%\lib\tools.jar;C:\Program Files\CData\CData JDBC Driver for Hive 2016\lib\cdata.jdbc.apachehive.jar;
    ...
    
  2. File メニューから New、Data Source と進み、新しいデータソースを作成します。
  3. 表示されるダイアログでデータソース名を入力し(例:CData JDBC Driver for Hive)、JDBC を選択して OK をクリックします。
  4. Get JDBC Connection Information ダイアログで、JDBC ドライバーへの接続を設定します。
    • Driver: Driver ボックスにチェックが入っていることを確認し、ドライバーのクラス名を入力します。
      cdata.jdbc.apachehive.ApacheHiveDriver
    • URL: JDBC URL を入力します。URL は jdbc:apachehive: から始まり、その後に接続プロパティをセミコロン区切りで記述します。

      Apache Hive への接続を確立するには以下を指定します。

      • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
      • Port:HiveServer2 インスタンスへの接続用のポートに設定。
      • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
      • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
      • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

      組み込みの接続文字列デザイナー

      JDBC URL の構築には、Hive JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。

      java -jar cdata.jdbc.apachehive.jar
      

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      JDBC URL を設定する際には、Max Rows 接続プロパティの設定も検討してください。これにより返される行数が制限され、レポートやビジュアライゼーションのデザイン時のパフォーマンス向上に役立ちます。

      一般的な JDBC URL は次のとおりです。

      jdbc:apachehive:Server=127.0.0.1;Port=10000;TransportMode=BINARY;
    • User: 認証に使用するユーザー名です。通常は空白のままにします。
    • Password: 認証に使用するパスワードです。通常は空白のままにします。
  5. Add Table ダイアログで、レポートに含めるテーブル(または、このデータソースを使用する今後のレポート用のテーブル)を選択し、Add をクリックします。

    テーブルの読み込みが完了したら Done をクリックします。

  6. Catalog Browser で、レポートを作成するためのクエリを作成できます。これはレポート作成前でも作成後でも行えます。データソース(CData JDBC Driver for Hive)を展開()し、Queries を右クリックして Add Query を選択します。
  7. Add Table/View/Query ダイアログで、JDBC URL と Tables を展開()し、クエリで使用するテーブルを選択して OK をクリックします。
  8. Query Editor ダイアログで、含めるカラムを選択するか、SQL ボタンをクリックして独自のクエリを手動で入力します。例えば次のようになります。
    SELECT City, CompanyName FROM Customers
    

    クエリが構築できたら、OK をクリックして Query Editor ダイアログを閉じます。これで Hive のデータ を新規または既存のレポートに追加する準備が整いました。

    NOTE: クエリが構築できたら、そのクエリをもとに Business View を作成できます。Business View を使用すると、クエリに基づいた Web レポートやライブラリコンポーネントを作成できます。詳しくは、JReport のチュートリアルを参照してください。

Hive ののデータをレポートに追加

これで Hive のデータ を使用したレポートを作成する準備が整いました。

  1. File メニューから New、Page Report と進んで新しいレポートを作成するか、既存のレポートの Chart Wizard を開きます。
  2. Query を選択します(または新規作成します。上記を参照)。
  3. クエリのカラムからチャートの Category と Value を設定し、Finish をクリックします。
  4. レポートの View タブをクリックして、チャートを表示します。

はじめる準備はできましたか?

Apache Hive Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Hive Icon Apache Hive JDBC Driver お問い合わせ

Apache Hive 互換ディストリビューション連携のパワフルなJava アプリケーションを素早く作成して配布。