Infragistics Reveal でSpark のデータを分析

杉本和也
杉本和也
リードエンジニア
CData Connect AI を使用してSpark のデータのOData API を作成し、Infragistics Reveal でSpark のデータをリアルタイムでビジュアライズします。

Reveal はInfragistics が提供するデータビジュアライゼーションツールであり、CData Connect AI と組み合わせることでSpark のデータから動的なダッシュボードを構築できます。CData Connect AI は、Spark へのリアルタイム接続を作成し、Spark のOData API(Reveal でネイティブにサポート)を生成するために使用できます。この記事では、Connect AI でのSpark への接続と、Infragistics Reveal からのConnect AI への接続について説明し、簡単なダッシュボードを作成します。

Connect AI を構成する

Infragistics Reveal でSpark のデータをリアルタイムで操作するには、Connect AI からSpark に接続し、コネクションにユーザーアクセスを提供してSpark のデータのOData エンドポイントを作成する必要があります。

(オプション)新しいConnect AI ユーザーの追加

必要であれば、Connect AI 経由でSpark に接続するユーザーを作成します。

  1. ユーザーページに移動し、 Invite Users をクリックします。
  2. 新しいユーザーのE メールアドレスを入力して、 Send to invite the user をクリックします。 新しいユーザーを招待
  3. ユーザーページからユーザーを確認および編集できます。 Connect AI users

パーソナルアクセストークンの追加

OAuth 認証をサポートしていないサービス、アプリケーション、プラットフォーム、またはフレームワークから接続する場合は、認証に使用するパーソナルアクセストークン(PAT)を作成できます。きめ細かなアクセス管理を行うために、サービスごとに個別のPAT を作成するのがベストプラクティスです。

  1. Connect AI アプリの右上にあるユーザー名をクリックし、User Profile をクリックします。
  2. User Profile ページで、Personal Access Tokens セクションまでスクロールし、Create PAT をクリックします。
  3. PAT に名前を付け、Create をクリックします。 Creating a new PAT
  4. パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。

Connect AI からSpark に接続

CData Connect AI では、簡単なクリック操作ベースのインターフェースでデータソースに接続できます。

  1. Connect AI にログインし、 Add Connection をクリックします。 Adding a Connection
  2. Add Connection パネルから「Spark」を選択します。 Selecting a data source
  3. 必要な認証プロパティを入力し、Spark に接続します。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

    Configuring a connection (Salesforce is shown)
  4. Create & Test をクリックします。
  5. Edit Spark Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。 権限を更新

Connect AI にSpark OData エンドポイントを追加する

Spark に接続したら、目的のテーブルのOData エンドポイントを作成します。

  1. OData ページに移動し、 Add to create new OData endpoints をクリックします。
  2. Spark コネクション(例:SparkSQL1)を選択し、Next をクリックします。
  3. 使用するテーブルを選択し、Confirm をクリックします。 テーブルを選択(Salesforce の例)

コネクションとOData エンドポイントが構成されたら、Infragistics Reveal からSpark に接続できるようになります。

Reveal でダッシュボードを作成

Connect AI を構成すると、Reveal でSpark のデータをビジュアライズできます。

  1. Reveal にログインし、Dashboards -> New とクリックします。 Adding a new dashboard
  2. Data Sources -> OData Feed とクリックします。 Adding a new OData data source
  3. (OData ページにある)Connect AI OData API エンドポイントURL を指定します:https://cloud.cdata.com/api/odata/service Configuring the OData URL
  4. Generic Credentials を選択し、
    • Username をConnect AI のユーザー名に設定します。(user@mydomain.com)
    • Password をユーザーのPAT に設定します。
    Configuring the credentials
  5. ビジュアライズするエンティティを選択します。 Selecting an entity to visualize (Salesforce is shown.)
  6. フィールドを選択し、チャートの種類を選択します。 Visualizing data in Reveal (Salesforce is shown.)

詳細と無料トライアル

これで、リアルタイムSpark のデータから簡単なダッシュボードが作成できました。Spark(および100を超えるほかのデータソース)からのOData フィードの作成方法の詳細については、Connect AI ページにアクセスしてください。無償トライアルにサインアップしてOData API を使用するツールでリアルタイムSpark のデータを分析しましょう。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ