CData Connect AI 経由で Boomi Agentstudio と Databricks のデータを統合

Dibyendu Datta
Dibyendu Datta
Lead Technology Evangelist
CData Connect AI を使用して、Boomi Agentstudio からDatabricks のデータへのセキュアでガバナンスの効いたアクセスを提供し、AI エージェントが統合・自動化ワークフロー内でライブエンタープライズデータに対してアクションを実行できるようにします。

Boomi Agentstudio は、タスクの自動化、統合ワークフローの強化、ビジネスプロセス全体でのインテリジェントな意思決定をサポートする AI エージェントを設計、オーケストレーション、ガバナンスするためのエンタープライズプラットフォームです。CData Connect AI と接続することで、Boomi Agentstudio は標準化された MCP ツールインターフェースを通じて、Databricks などのライブエンタープライズデータにセキュアにアクセス、クエリ、アクションを実行できます。

CData Connect AI は、エンタープライズデータシステムへのガバナンスが効いたリアルタイムアクセスを提供するマネージド Model Context Protocol(MCP)プラットフォームです。350 以上のデータソースにわたって、カタログ、スキーマ、テーブル、SQL クエリを含む構造化されたメタデータを公開します。Connect AI を使用すると、Boomi Agentstudio は ETL パイプライン、データレプリケーション、カスタム統合コードを必要とせずに、ライブの運用データをエージェントロジックとワークフロー自動化に直接取り込むことができます。

この記事では、Boomi Agentstudio を CData Connect AI MCP エンドポイントに接続し、Databricks やその他のサポート対象データソースへのアクセスを設定し、エージェント駆動型ワークフロー内からリアルタイムクエリを発行する方法を説明します。

Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


前提条件

ステップ 1:Boomi Agentstudio 用に Databricks への接続を設定

Boomi Agentstudio が Databricks にアクセスするには、CData Connect AI で Databricks への接続を作成します。この接続は Remote MCP Server を介して Boomi に公開されます。

  1. Connect AI にログインし、Sources をクリック、次に + Add Connection をクリック
  2. 利用可能なデータソースから Databricks を選択
  3. Databricks に接続するために必要な認証プロパティを入力します。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • 個人用アクセストークン
    • Microsoft Entra ID(Azure AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    個人用アクセストークン

    認証するには、次を設定します。

    • AuthSchemePersonalAccessToken
    • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

  4. 「Create & Test」をクリック
  5. 認証が完了したら、Databricks 接続の Permissions タブを開き、必要に応じてユーザーベースのアクセス許可を設定します。

Personal Access Token(PAT)の生成

Boomi Agentstudio はアカウントのメールアドレスと Personal Access Token(PAT) を使用して Connect AI に認証します。アクセス制御の粒度を維持するために、統合ごとに個別の PAT を作成することをお勧めします。

  1. Connect AI で、右上の 歯車アイコン を選択して Settings を開きます。
  2. Access TokensCreate PAT を選択します。
  3. トークンの説明的な名前を入力し、Create を選択します。
  4. トークンをコピーして安全に保存します。PAT は作成時にのみ表示されます。

Databricks 接続と PAT が設定できたので、Boomi Agentstudio は CData Connect AI MCP サーバー経由でDatabricks のデータに接続する準備が整いました。

ステップ 2:CData Connect AI MCP エンドポイントを使用してソースを作成

まず、Boomi Agentstudio 内に新しい MCP データソースを作成します。これにより Boomi と CData Connect AI 間のセキュアな接続が確立され、エージェントが MCP ツールを呼び出してライブエンタープライズデータを操作できるようになります。

Connect AI MCP をソースとして接続するには、以下のプロセスに従います。

  1. Boomi にログインします。
  2. Services を開き、リストから Agentstudio を選択します。
  3. Sources タブに移動し、Create a new source をクリックします。
  4. Agent Designer ウィンドウで Sources タブを開き、ソースタイプとして Model Context Protocol (MCP) を選択します。
  5. Create MCP Source 画面で、以下の Configuration 詳細を入力します。
    • Name: ソースの名前を入力
    • Details: ソースの簡単な説明を追加
    • Transport Type: Streamable HTTP
    • URL: https://mcp.cloud.cdata.com/mcp
    • Authentication: Basic Authentication
    • Username: Connect AI アカウントのユーザー名を入力
    • Password: Connect AI の PAT を入力
  6. Test Connection をクリックします。
  7. 接続が成功したら、Discover Tools をクリックします。Boomi は queryDatagetCatalogsgetSchemasgetTables などの CData Connect AI によって公開されているすべての MCP ツールを Tools タブに一覧表示します。
  8. Discover and Select Tools セクションですべてのツールを選択し、Continue をクリックします。
  9. Review セクションで詳細を確認し、Save をクリックします。

Boomi は新しいソースを Sources タブに追加します。

Tools タブをクリックして、CData Connect AI のすべてのツールがリストに表示されていることを確認します。

ステップ 3:新しいエージェントを作成

Databricks のデータ とやりとりするための新しいエージェントを作成します。エージェントはプロンプトと Connect AI によって公開されたツール間のインターフェースとして機能し、クエリを処理してインテリジェントなレスポンスを返すことができます。

  1. Agents タブに移動し、Create New Agent をクリックします。
  2. Agent Designer ウィンドウで、Agents タブの下にある Blank Template を選択します。
  3. Profile セクションで以下の詳細を入力します。
    • Basic Information: ゴール、エージェント名、エージェント画像を指定
    • Agent Mode: プロンプトへの応答方法に基づいて Conversational または Structured モードを選択し、それに応じてモードを設定
  4. Save and Continue をクリックします。
  5. Tasks セクションで、エージェントが実行するアクションを定義します。
    1. + Add New Task をクリックします。
    2. Description タブでタスク名と説明を入力します。
    3. Instructions タブで + Add New Instruction をクリックし、このタスク内でエージェントがツールを使用する方法を説明します。
    4. Tools タブで + Add New Tool をクリックし、Connect AI によって公開されたツールを選択します。Update Selected Tool をクリックし、Requires ApprovalData Passthrough を有効にして、タスクを保存し、Save and Continue をクリックします。

    注意: すべてのタスクで最大 25 個のツールを追加できます。

  6. Guardrails セクションで、エージェントがセキュアかつ倫理的に動作するためのルール、制限、フィルターを定義します。必要に応じてブロックメッセージ、拒否トピック、ワードフィルター、カスタム正規表現パターンを追加します。Save and Continue をクリックします。
  7. Review セクションですべての詳細を確認し、Deploy をクリックしてエージェントをデプロイします。

エージェントをデプロイしたら、チャットインターフェースでプロンプトに対する正確でコンテキストに沿ったレスポンスを生成するために使用できます。

ステップ 4:エージェントを使用してDatabricks のデータにプロンプトを送信

エージェントを作成してデプロイしたら、自然言語プロンプトを使用してDatabricks のデータとやりとりできます。

Databricks のデータ にプロンプトを送信するには、以下のステップに従います。

  1. Chat タブに移動し、ドロップダウンリストからエージェントを選択します。
  2. プロンプトを入力します(例: 「Databricks で利用可能なテーブルはいくつありますか?」)。
  3. エージェントがプロンプトを処理して結果を返します。

CData Connect AI を入手

クラウドアプリケーションから直接 300 以上の SaaS、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスを取得するには、CData Connect AI をお試しください。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ