Denodo Platform で Google Data Catalog のデータ に接続

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
CData ドライバーを使用して、Denodo Virtual DataPort Administrator で Google Data Catalog のデータ 用の仮想データソースを作成する方法を説明します。

Denodo Platform は、エンタープライズデータベースのデータを統合的に扱うことができるデータ仮想化製品です。CData JDBC Driver for Google Data Catalog と組み合わせることで、Denodo ユーザーは他のエンタープライズデータソースと並んでライブ Google Data Catalog のデータ を扱うことができます。本記事では、Denodo Virtual DataPort Administrator で Google Data Catalog 用の仮想データソースを作成する方法を解説します。

CData JDBC Driver は、最適化されたデータ処理機能を内蔵しており、ライブ Google Data Catalog のデータ とのやり取りにおいて比類のないパフォーマンスを提供します。Google Data Catalog に対して複雑な SQL クエリを発行すると、ドライバーはフィルターや集計などのサポートされている SQL 操作を直接 Google Data Catalog にプッシュし、内蔵の SQL エンジンを使用してサポートされていない操作(主に SQL 関数や JOIN 操作)をクライアントサイドで処理します。また、動的メタデータクエリ機能を内蔵しているため、ネイティブデータ型を使用して Google Data Catalog のデータ を操作・分析できます。

Google Data Catalog 仮想ポートの作成

Denodo からライブ Google Data Catalog のデータ に接続するには、JDBC Driver の JAR ファイルを Denodo の外部ライブラリディレクトリにコピーし、Virtual DataPort Administrator ツールで新しい JDBC データソースを作成します。

  1. CData JDBC Driver for Google Data Catalog インストーラーをダウンロードし、パッケージを解凍して JAR ファイルを実行してドライバーをインストールします。
  2. インストール先(通常は C:\Program Files\CData\CData JDBC Driver for Google Data Catalog\lib\)から JAR ファイル(およびライセンスファイルが存在する場合はそれも)を Denodo 外部ライブラリディレクトリ(C:\Denodo\Denodo Platform\lib-external\jdbc-drivers\cdata-googledatacatalog-19)にコピーします。
  3. Denodo Virtual DataPort Administrator ツールを開き、Server Explorer タブに移動します。
  4. "admin" を右クリックし、New -> Data source -> JDBC を選択します。
  5. JDBC 接続を設定します:
    • Name: 任意の名前(例: googledatacatalog)
    • Database adapter: Generic
    • Driver class path: C:\Denodo\Denodo Platform\lib-external\jdbc-drivers\cdata-googledatacatalog-19
    • Driver class: cdata.jdbc.googledatacatalog.GoogleDataCatalogDriver
    • Database URI: 必要な接続プロパティを使用して JDBC URL を設定します。例:

      jdbc:googledatacatalog:ProjectId=YourProjectId;

      Database URI の作成方法は以下のとおりです:

      ビルトイン接続文字列デザイナー

      JDBC URL の構築には、Google Data Catalog JDBC Driver に組み込まれた接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行してください。

      	java -jar cdata.jdbc.googledatacatalog.jar
      	

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      Google Data Catalog 接続プロパティの取得・設定方法

      認証プロパティを追加する前に、次の接続プロパティを設定してください。

      • OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。 「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
      • ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。

      Google Data Catalog への認証

      CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。

      OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。

  6. "Test connection" ボタンをクリックして設定を確認し、Save をクリックします。

VirtualPort Administrator ツールで Google Data Catalog のデータ を表示

データソースを作成したら、Denodo Platform で使用する Google Data Catalog のデータ のベースビューを作成できます。

  1. 新しく作成した VirtualPort (admin.GoogleDataCatalog) で "Create base view" ボタンをクリックします。
  2. オブジェクトツリーを展開し、インポートするオブジェクト(テーブル)を選択します。
  3. "Create selected" ボタンをクリックして、Google Data Catalog のデータ のビューを作成します。
    オプション: "Create associations from foreign keys" をクリックして、オブジェクト間のリレーションシップを定義できます。
  4. ビューが作成されたら、Server Explorer で対象テーブル(cdata_googledatacatalog_schemas)に移動し、選択したテーブルをダブルクリックします。
  5. 新しいタブで "Execution panel" をクリックしてクエリパネルを開きます。
  6. "Execute" タブでクエリをカスタマイズするか、デフォルトのクエリを使用します:
    SELECT * FROM cdata_googledatacatalog_schemas CONTEXT ('i18n'='us_est', 'cache_wait_for_load'='true')
    
  7. Execute をクリックしてデータを表示します。

ベースビューの作成後は、Denodo Platform の他のデータソースと同様にライブ Google Data Catalog のデータ を扱うことができます。たとえば、Denodo Data Catalog で Google Data Catalog をクエリできます。

CData JDBC Driver for Google Data Catalog の 30日間無料トライアルをダウンロードして、Denodo Platform でライブ Google Data Catalog のデータ の活用を始めましょう。ご不明な点がございましたら、サポートチーム までお問い合わせください。

はじめる準備はできましたか?

Google Data Catalog Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Google Data Catalog Icon Google Data Catalog JDBC Driver お問い合わせ

Google Data Catalog データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。