Denodo Platform で Google Data Catalog のデータ に接続
Denodo Platform は、エンタープライズデータベースのデータを統合的に扱うことができるデータ仮想化製品です。CData JDBC Driver for Google Data Catalog と組み合わせることで、Denodo ユーザーは他のエンタープライズデータソースと並んでライブ Google Data Catalog のデータ を扱うことができます。本記事では、Denodo Virtual DataPort Administrator で Google Data Catalog 用の仮想データソースを作成する方法を解説します。
CData JDBC Driver は、最適化されたデータ処理機能を内蔵しており、ライブ Google Data Catalog のデータ とのやり取りにおいて比類のないパフォーマンスを提供します。Google Data Catalog に対して複雑な SQL クエリを発行すると、ドライバーはフィルターや集計などのサポートされている SQL 操作を直接 Google Data Catalog にプッシュし、内蔵の SQL エンジンを使用してサポートされていない操作(主に SQL 関数や JOIN 操作)をクライアントサイドで処理します。また、動的メタデータクエリ機能を内蔵しているため、ネイティブデータ型を使用して Google Data Catalog のデータ を操作・分析できます。
Google Data Catalog 仮想ポートの作成
Denodo からライブ Google Data Catalog のデータ に接続するには、JDBC Driver の JAR ファイルを Denodo の外部ライブラリディレクトリにコピーし、Virtual DataPort Administrator ツールで新しい JDBC データソースを作成します。
- CData JDBC Driver for Google Data Catalog インストーラーをダウンロードし、パッケージを解凍して JAR ファイルを実行してドライバーをインストールします。
- インストール先(通常は C:\Program Files\CData\CData JDBC Driver for Google Data Catalog\lib\)から JAR ファイル(およびライセンスファイルが存在する場合はそれも)を Denodo 外部ライブラリディレクトリ(C:\Denodo\Denodo Platform\lib-external\jdbc-drivers\cdata-googledatacatalog-19)にコピーします。
- Denodo Virtual DataPort Administrator ツールを開き、Server Explorer タブに移動します。
- "admin" を右クリックし、New -> Data source -> JDBC を選択します。
- JDBC 接続を設定します:
- Name: 任意の名前(例: googledatacatalog)
- Database adapter: Generic
- Driver class path: C:\Denodo\Denodo Platform\lib-external\jdbc-drivers\cdata-googledatacatalog-19
- Driver class: cdata.jdbc.googledatacatalog.GoogleDataCatalogDriver
Database URI: 必要な接続プロパティを使用して JDBC URL を設定します。例:
jdbc:googledatacatalog:ProjectId=YourProjectId;
Database URI の作成方法は以下のとおりです:
ビルトイン接続文字列デザイナー
JDBC URL の構築には、Google Data Catalog JDBC Driver に組み込まれた接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行してください。
java -jar cdata.jdbc.googledatacatalog.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
Google Data Catalog 接続プロパティの取得・設定方法
認証プロパティを追加する前に、次の接続プロパティを設定してください。
- OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。 「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
- ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。
Google Data Catalog への認証
CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。
OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。
- "Test connection" ボタンをクリックして設定を確認し、Save をクリックします。
VirtualPort Administrator ツールで Google Data Catalog のデータ を表示
データソースを作成したら、Denodo Platform で使用する Google Data Catalog のデータ のベースビューを作成できます。
- 新しく作成した VirtualPort (admin.GoogleDataCatalog) で "Create base view" ボタンをクリックします。
- オブジェクトツリーを展開し、インポートするオブジェクト(テーブル)を選択します。
- "Create selected" ボタンをクリックして、Google Data Catalog のデータ のビューを作成します。
オプション: "Create associations from foreign keys" をクリックして、オブジェクト間のリレーションシップを定義できます。 - ビューが作成されたら、Server Explorer で対象テーブル(cdata_googledatacatalog_schemas)に移動し、選択したテーブルをダブルクリックします。
- 新しいタブで "Execution panel" をクリックしてクエリパネルを開きます。
- "Execute" タブでクエリをカスタマイズするか、デフォルトのクエリを使用します:
SELECT * FROM cdata_googledatacatalog_schemas CONTEXT ('i18n'='us_est', 'cache_wait_for_load'='true')
- Execute をクリックしてデータを表示します。
ベースビューの作成後は、Denodo Platform の他のデータソースと同様にライブ Google Data Catalog のデータ を扱うことができます。たとえば、Denodo Data Catalog で Google Data Catalog をクエリできます。
CData JDBC Driver for Google Data Catalog の 30日間無料トライアルをダウンロードして、Denodo Platform でライブ Google Data Catalog のデータ の活用を始めましょう。ご不明な点がございましたら、サポートチーム までお問い合わせください。