Infragistics Reveal でSpark のデータを分析
Reveal はInfragistics が提供するデータビジュアライゼーションツールであり、CData Connect AI と組み合わせることでSpark のデータから動的なダッシュボードを構築できます。CData Connect AI は、Spark へのリアルタイム接続を作成し、Spark のOData API(Reveal でネイティブにサポート)を生成するために使用できます。この記事では、Connect AI でのSpark への接続と、Infragistics Reveal からのConnect AI への接続について説明し、簡単なダッシュボードを作成します。
Connect AI を構成する
Infragistics Reveal でSpark のデータをリアルタイムで操作するには、Connect AI からSpark に接続し、コネクションにユーザーアクセスを提供してSpark のデータのOData エンドポイントを作成する必要があります。
(オプション)新しいConnect AI ユーザーの追加
必要であれば、Connect AI 経由でSpark に接続するユーザーを作成します。
- ユーザーページに移動し、 Invite Users をクリックします。
- 新しいユーザーのE メールアドレスを入力して、 Send to invite the user をクリックします。
- ユーザーページからユーザーを確認および編集できます。
パーソナルアクセストークンの追加
OAuth 認証をサポートしていないサービス、アプリケーション、プラットフォーム、またはフレームワークから接続する場合は、認証に使用するパーソナルアクセストークン(PAT)を作成できます。きめ細かなアクセス管理を行うために、サービスごとに個別のPAT を作成するのがベストプラクティスです。
- Connect AI アプリの右上にあるユーザー名をクリックし、User Profile をクリックします。
- User Profile ページで、Personal Access Tokens セクションまでスクロールし、Create PAT をクリックします。
- PAT に名前を付け、Create をクリックします。
- パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。
Connect AI からSpark に接続
CData Connect AI では、簡単なクリック操作ベースのインターフェースでデータソースに接続できます。
- Connect AI にログインし、 Add Connection をクリックします。
- Add Connection パネルから「Spark」を選択します。
-
必要な認証プロパティを入力し、Spark に接続します。
SparkSQL への接続
SparkSQL への接続を確立するには以下を指定します。
- Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
- Port:SparkSQL インスタンスへの接続用のポートに設定。
- TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
Databricks への接続
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
- Server:Databricks クラスターのサーバーのホスト名に設定。
- Port:443
- TransportMode:HTTP
- HTTPPath:Databricks クラスターのHTTP パスに設定。
- UseSSL:True
- AuthScheme:PLAIN
- User:'token' に設定。
- Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。
- Create & Test をクリックします。
- Edit Spark Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。
Connect AI にSpark OData エンドポイントを追加する
Spark に接続したら、目的のテーブルのOData エンドポイントを作成します。
- OData ページに移動し、 Add to create new OData endpoints をクリックします。
- Spark コネクション(例:SparkSQL1)を選択し、Next をクリックします。
- 使用するテーブルを選択し、Confirm をクリックします。
コネクションとOData エンドポイントが構成されたら、Infragistics Reveal からSpark に接続できるようになります。
Reveal でダッシュボードを作成
Connect AI を構成すると、Reveal でSpark のデータをビジュアライズできます。
- Reveal にログインし、Dashboards -> New とクリックします。
- Data Sources -> OData Feed とクリックします。
- (OData ページにある)Connect AI OData API エンドポイントURL を指定します:https://cloud.cdata.com/api/odata/service
- Generic Credentials を選択し、
- Username をConnect AI のユーザー名に設定します。(user@mydomain.com)
- Password をユーザーのPAT に設定します。
- ビジュアライズするエンティティを選択します。
- フィールドを選択し、チャートの種類を選択します。
詳細と無料トライアル
これで、リアルタイムSpark のデータから簡単なダッシュボードが作成できました。Spark(および100を超えるほかのデータソース)からのOData フィードの作成方法の詳細については、Connect AI ページにアクセスしてください。無償トライアルにサインアップしてOData API を使用するツールでリアルタイムSpark のデータを分析しましょう。