Pentaho Report Designer でGoogle Data Catalog のデータを連携利用

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Pentaho BI ツールでGoogle Data Catalog のデータをもとにしたレポートを公開。

CData JDBC Driver for Google Data Catalog のデータ を使えば、ダッシュボードやレポートからリアルタイムデータにアクセスできます。この記事では、Google Data Catalog のデータにJDBC データソースとして接続し、Pentaho でGoogle Data Catalog のデータをもとにしたレポートを公開する方法を説明します。

接続してレポートを作成

  1. インストールディレクトリのlib サブフォルダ内にあるドライバーのJAR ファイルを、Pentaho ディレクトリ内の\Report-Designer\lib\jdbc\ フォルダにコピーします。
  2. \Report-Designer\ フォルダ内のreport-designer.bat ファイルを実行してReport-Designer UI を開きます。
  3. Data -> Add Data Source -> Advanced -> JDBC(Custom)をクリックし、新しいGoogle Data Catalog 接続を作成して、ドライバーで新しいデータソースを作成します。 表示されるダイアログで、以下のように接続プロパティを設定します。

    • Custom Connection URL property:JDBC URL を入力します。JDBC URL はjdbc:googledatacatalog: で始まり、その後にセミコロン区切りで接続プロパティを指定します。

      Google Data Catalog 接続プロパティの取得・設定方法

      認証プロパティを追加する前に、次の接続プロパティを設定してください。

      • OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。 「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
      • ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。

      Google Data Catalog への認証

      CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。

      OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。

      組み込みの接続文字列デザイナー

      JDBC URL の構成については、Google Data Catalog JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインからJAR ファイルを実行します。

      java -jar cdata.jdbc.googledatacatalog.jar
      

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      JDBC URL を設定する際、Max Rows 接続プロパティの設定も検討してください。これにより返される行数が制限されます。特にレポートやビジュアライゼーションを設計する際のパフォーマンス向上に役立ちます。

      一般的なJDBC URL は次のとおりです:

      jdbc:googledatacatalog:ProjectId=YourProjectId;
    • Custom Driver Class Name:cdata.jdbc.googledatacatalog.GoogleDataCatalogDriver を入力します。
    • User Name:認証に使用するユーザー名。
    • Password:認証に使用するパスワード。

レポートにGoogle Data Catalog のデータを追加

Google Data Catalog のデータをもとにレポートを作成する準備が整いました。

  1. レポートにGoogle Data Catalog のソースを追加します。Data -> Add Data Source -> JDBC をクリックしてデータソースを選択します。

  2. クエリを設定します。この記事では以下のクエリを使用します:

    SELECT Type, DatasetName FROM Schemas WHERE ProjectId = 'bigquery-public-data'
  3. レポートにチャートをドラッグし、ダブルクリックしてチャートを編集します。レポートを実行してチャートを表示します。このクエリの結果を使用して、Schemas テーブルのシンプルなチャートを作成できます。
  4. 最後に、レポートを実行してチャートを確認します。

はじめる準備はできましたか?

Google Data Catalog Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Google Data Catalog Icon Google Data Catalog JDBC Driver お問い合わせ

Google Data Catalog データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。