DataGrip で Google Data Catalog のデータ をクエリ

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
DataGrip で Google Data Catalog のデータソースを作成し、SQL を使用してリアルタイムGoogle Data Catalog のデータをクエリ。

DataGrip は、SQL 開発者がデータベースへのクエリ、作成、管理を行えるデータベース IDE です。CData JDBC Driver for Google Data Catalog と組み合わせることで、DataGrip からリアルタイムGoogle Data Catalog のデータを操作できます。この記事では、DataGrip で Google Data Catalog のデータ への接続を確立方法を説明します。

Google Data Catalog 用の新しいドライバー定義を作成

以下のステップでは、DataGrip で Google Data Catalog 用の新しいデータソースを作成する方法を説明します。

  1. DataGrip で、File -> New -> Project をクリックしてプロジェクト名を入力します。
  2. Database Explorer で、プラスアイコン()をクリックして Driver を選択します。
  3. Driver タブで以下を設定します。
    • Name をわかりやすい名前に設定します(例:"CData Google Data Catalog Driver")。
    • Driver Files を適切な JAR ファイルに設定します。ファイルを追加するには、プラス()をクリックし、「Add Files」を選択して、ドライバーのインストールディレクトリ内の「lib」フォルダに移動し、JAR ファイル(例:cdata.jdbc.googledatacatalog.jar)を選択します。
    • Class を cdata.jdbc.googledatacatalog.GoogleDataCatalog.jar に設定します。
    また、詳細タブでは、ドライバーのプロパティや、VM Options、VM environment、VM home path、DBMS などの設定を変更できます。
    • ほとんどの場合、Expert optionsDBMS type を「Unknown」に変更して、ネイティブの SQL Server クエリ(Transact-SQL)を回避してください。これを行わないと、無効な関数エラーが発生する可能性があります。
  4. 「Apply」をクリックし、「OK」をクリックして接続を保存します。

Google Data Catalog への接続を設定

  1. 接続を保存したら、プラス()をクリックし、「Data Source」→「CData Google Data Catalog Driver」を選択して、新しい Google Data Catalog データソースを作成します。
  2. 新しいウィンドウで、JDBC URL を使用して Google Data Catalog への接続を設定します。

    組み込みの接続文字列デザイナー

    JDBC URL の構築には、Google Data Catalog JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。

          java -jar cdata.jdbc.googledatacatalog.jar
        

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    Google Data Catalog 接続プロパティの取得・設定方法

    認証プロパティを追加する前に、次の接続プロパティを設定してください。

    • OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。 「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
    • ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。

    Google Data Catalog への認証

    CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。

    OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。

  3. URL を接続文字列に設定します。例:
    jdbc:googledatacatalog:ProjectId=YourProjectId;
  4. 「Apply」と「OK」をクリックして接続文字列を保存します。

これで、Data Explorer にデータソースが表示されます。

Google Data Catalog に対して SQL クエリを実行

JDBC Driver を介してアクセス可能な Google Data Catalog のエンティティ(テーブルとして利用可能)を参照するには、データソースを展開します。

クエリを実行するには、任意のテーブルを右クリックして「New」→「Query Console」を選択します。

Console で、実行したい SQL クエリを記述します。例:

SELECT Type, DatasetName FROM Schemas WHERE ProjectId = 'bigquery-public-data'

CData JDBC Driver for Google Data Catalog の30日間の無料トライアルをダウンロードして、DataGrip でリアルタイムGoogle Data Catalog のデータを操作してみてください。ご不明な点があれば、サポートチームにお問い合わせください。

はじめる準備はできましたか?

Google Data Catalog Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Google Data Catalog Icon Google Data Catalog JDBC Driver お問い合わせ

Google Data Catalog データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。