Google Data Catalog JDBC Driver を使用した OBIEE でのレポート作成
CData JDBC Driver for Google Data Catalog は、標準的なデータベースドライバーとして、Java ベースのレポーティングサーバーにGoogle Data Catalog のデータへのリアルタイムアクセスを統合できます。この記事では、Oracle Business Intelligence Enterprise Edition(OBIEE)にドライバーをデプロイし、変更がリアルタイムに反映されるGoogle Data Catalog のデータのレポートを作成する方法を説明します。
JDBC Driver のデプロイ
以下の手順で、JDBC Driver を WebLogic のクラスパスに追加します。
WebLogic 12.2.1 の場合、ドライバーの JAR ファイルと .lic ファイルを DOMAIN_HOME\lib に配置するだけで完了です(例:ORACLE_HOME\user_projects\domains\MY_DOMAIN\lib)。これらのファイルは起動時にサーバーのクラスパスに追加されます。
手動でクラスパスにドライバーを追加することもできます(以前のバージョンでは必須)。setDomainEnv.cmd(Windows)または setDomainEnv.sh(Unix)の PRE_CLASSPATH の先頭に以下を追加します。このスクリプトは、そのドメインのフォルダ内の bin サブフォルダにあります(例:ORACLE_HOME\user_projects\domains\MY_DOMAIN\bin)。
set PRE_CLASSPATH=your-installation-directory\lib\cdata.jdbc.googledatacatalog.jar;%PRE_CLASSPATH%
すべてのサーバーを再起動します(例:DOMAIN_HOME\bitools\bin の stop コマンドと start コマンドを実行)。
Google Data Catalog 用 JDBC データソースの作成
JDBC Driver をデプロイしたら、BI Publisher から JDBC データソースを作成できます。
- BI Publisher にログインします(URL は例えば http://localhost:9502/analytics)。Administration -> Manage BI Publisher をクリックします。
- JDBC Connection -> Add Data Source をクリックします。
- 以下の情報を入力します:
- Data Source Name:ユーザーがレポートで接続を作成する際に使用する名前を入力します。
- Driver Type:Other を選択します。
- Database DriverClass:ドライバークラス cdata.jdbc.googledatacatalog.GoogleDataCatalogDriver を入力します。
- Connection String:JDBC URL を入力します。
Google Data Catalog 接続プロパティの取得・設定方法
認証プロパティを追加する前に、次の接続プロパティを設定してください。
- OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。 「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
- ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。
Google Data Catalog への認証
CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。
OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。
組み込みの接続文字列デザイナー
JDBC URL の構築には、Google Data Catalog JDBC Driver に組み込まれた接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。
java -jar cdata.jdbc.googledatacatalog.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
JDBC URL を構成する際、Max Rows 接続プロパティの設定も検討してください。これにより返される行数が制限され、レポートやビジュアライゼーションの設計時のパフォーマンス向上に特に役立ちます。
一般的な JDBC URL は以下のとおりです:
jdbc:googledatacatalog:ProjectId=YourProjectId;
- Username:ユーザー名を入力します。
- Password:パスワードを入力します。
- Security セクションで、許可するユーザーロールを選択します。
リアルタイム Google Data Catalog レポートの作成
これで、リアルタイムGoogle Data Catalog のデータに基づいたレポートや分析を作成できます。以下の手順で、標準のレポートウィザードを使用して、Google Data Catalog のデータの変更がリアルタイムに反映されるインタラクティブなレポートを作成します。
- グローバルヘッダーで、New -> Data Model をクリックします。
- Diagram タブで、メニューから SQL query を選択します。
- クエリの名前を入力し、Data Source メニューで作成した Google Data Catalog JDBC データソースを選択します。
- standard SQL を選択し、以下のようなクエリを入力します:
SELECT Type, DatasetName FROM Schemas WHERE ProjectId = 'bigquery-public-data'
- View Data をクリックして、レポート作成に使用するサンプルデータを生成します。
- サンプルデータに含める行数を選択し、View をクリックしてから、Save As Sample Data をクリックします。
- Create Report -> Use Data Model をクリックします。
- Guide Me を選択し、Select Layout ページで含めるレポートオブジェクトを選択します。この例では Chart と Table を選択します。
- DatasetName のような数値カラムを Y 軸の Drop Value Here ボックスにドロップします。Type のようなディメンションカラムを X 軸の Drop Label Here ボックスにドロップします。
- Refresh をクリックすると、Google Data Catalog のデータの変更が反映されます。