Pentaho Data Integration でAirtable のデータを連携

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Pentaho Data Integration で Airtable のデータ をベースにした ETL パイプラインを構築します。

CData JDBC Driver for Airtable を使用すると、データパイプラインからリアルタイムデータにアクセスできます。Pentaho Data Integration は、ETL(Extraction, Transformation, and Loading)エンジンであり、データをクレンジングし、アクセス可能な統一フォーマットでデータを格納します。この記事では、Airtable のデータ に JDBC データソースとして接続し、Pentaho Data Integration で Airtable のデータ をベースにしたジョブやトランスフォーメーションを構築する方法を説明します。

Airtable への接続を設定

Airtable への接続

それでは、Airtable に接続していきましょう。CData 製品は、Airtable にテーブルとビューを要求します。 Schema プロパティ(オプション)を使用すると、表示されるテーブルおよびビューを特定のベースに制限できます。 特定のベースに制限したい場合は、このプロパティを使用するスキーマの名前に設定してください。(これはAirtable のBase 名に相当します。)

すべてのAirtable Bases に加えて、DataModelInformation という名前の静的スキーマもご利用いただけます。 このスキーマでは、Bases、Tables、Users のような静的テーブルをクエリできます。 DisplayObjectIdsTrue に設定されている場合、Schema の値は名前ではなくAirtable Base id に設定する必要があります。

Airtableへの認証

続いて、認証方法を設定しましょう。個人用アクセストークンまたはOAuth PKCE のいずれかを使用してAirtable に認証できます。

個人用アクセストークン

個人用アクセストークンをまだ生成していない場合は、以下のステップで生成してみましょう。

  1. ユーザーアカウントにログインします
  2. "https://airtable.com/create/tokens" に移動します
  3. Create new token をクリックします
  4. Scopes で、Add a scope をクリックして以下の各スコープを追加します
    • data.records:read
    • data.records:write
    • schema.bases:read
  5. Access で、トークンにアクセス権を付与するすべてのワークスペースとベースを追加します
  6. Create token をクリックしてトークンを生成します。生成されたトークンは一度しか表示されませんので、必ずコピーして保存してください

次に、以下の設定を行います。

  • AuthSchemePersonalAccessToken
  • Token:先ほど生成した個人用アクセストークンの値

OAuth PKCE については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「はじめに」をご確認ください。

組み込みの接続文字列デザイナー

JDBC URL の構築を支援するには、Airtable JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。

java -jar cdata.jdbc.airtable.jar

接続プロパティを設定し、接続文字列をクリップボードにコピーします。

JDBC URL を設定する際には、Max Rows 接続プロパティの設定も検討してください。これにより返される行数が制限され、レポートやビジュアライゼーションの設計時にパフォーマンスを向上させることができます。

一般的な JDBC URL は次のようになります:

jdbc:airtable:APIKey=keymz3adb53RqsU;BaseId=appxxN2fe34r3rjdG7;TableNames=TableA,...;ViewNames=TableA.ViewA,...;

接続文字列を保存して、Pentaho Data Integration で使用します。

Pentaho DI から Airtable に接続

Pentaho Data Integration を開き、「Database Connection」を選択して CData JDBC Driver for Airtable への接続を設定します。

  1. 「General」をクリックします。
  2. Connection name を設定します(例:Airtable Connection)。
  3. Connection type を「Generic database」に設定します。
  4. Access を「Native (JDBC)」に設定します。
  5. Custom connection URL に Airtable の接続文字列を設定します(例:
    jdbc:airtable:APIKey=keymz3adb53RqsU;BaseId=appxxN2fe34r3rjdG7;TableNames=TableA,...;ViewNames=TableA.ViewA,...;
    )。
  6. Custom driver class name を「cdata.jdbc.airtable.AirtableDriver」に設定します。
  7. 接続をテストし、「OK」をクリックして保存します。

Airtable のデータパイプラインを作成

CData JDBC Driver を使用して Airtable への接続が設定されたら、新しいトランスフォーメーションまたはジョブを作成する準備が整いました。

  1. 「File」>>「New」>>「Transformation/job」をクリックします。
  2. 「Table input」オブジェクトをワークフローパネルにドラッグし、Airtable 接続を選択します。
  3. 「Get SQL select statement」をクリックし、Database Explorer を使用して利用可能なテーブルとビューを表示します。
  4. テーブルを選択し、必要に応じてデータをプレビューして確認します。

ここから、適切な同期先を選択し、レプリケーション中にデータを変更、フィルタリング、その他の処理を行うトランスフォーメーションを追加することで、トランスフォーメーションまたはジョブを続行できます。

無料トライアルと詳細情報

CData JDBC Driver for Airtable の 30日間無料トライアルをダウンロードして、Pentaho Data Integration で Airtable のデータ のリアルタイムデータを今すぐ活用しましょう。

はじめる準備はできましたか?

Airtable Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Airtable Icon Airtable JDBC Driver お問い合わせ

Airtable に連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。