JBoss のコネクションプールから Spark のデータに接続

Jerod Johnson
Senior Technology Evangelist

Spark のデータを Java サーブレットに統合：JBoss の管理コンソールを使用して Spark JDBC Driver をインストール。

CData JDBC Driver は、コネクションプーリングの標準手順に従ってJBoss で設定できます。本記事では、JBoss アプリケーションのコネクションプールから Spark のデータにアクセスする方法を解説します。JBoss 管理インターフェースを使用して CData JDBC Driver for Spark を設定し、コネクションプールから Spark のデータにアクセスします。

管理コンソールから Spark 用のJDBC データソースを作成

以下の手順に従って、ドライバーJAR を追加し、必要な接続プロパティを定義します。

Runtime メニューで、管理ドメインにデプロイするかスタンドアロンサーバーにデプロイするかに応じて、Domain またはServer メニューを選択し、「Manage deployments」をクリックしてDeployments ページを開きます。
Add をクリックします。表示されるウィザードで、インストールディレクトリのlib サブフォルダにあるドライバーのJAR ファイルとライセンスを追加します。デフォルト設定でウィザードを完了し、ドライバーを選択してEnable をクリックします。
Configuration メニューで、Subsystems -> Connector -> Datasources をクリックします。JDBC Datasources ページが開きます。
Add をクリックし、表示されるウィザードでドライバーの名前とJNDI 名を入力します。例：
```
java:jboss/root/jdbc/SparkSQL
```
上記で追加したドライバーを選択します。
JDBC URL とユーザー名、パスワードを入力します。JDBC URL の構文は、jdbc:sparksql: の後にセミコロン区切りの接続プロパティを記述します。

SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。
- Server：SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
- Port：SparkSQL インスタンスへの接続用のポートに設定。
- TransportMode：SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme：使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note：必要な値は、「クラスター」に移動して目的のクラスターを選択し、「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
- Server：Databricks クラスターのサーバーのホスト名に設定。
- Port：443
- TransportMode：HTTP
- HTTPPath：Databricks クラスターのHTTP パスに設定。
- UseSSL：True
- AuthScheme：PLAIN
- User：'token' に設定。
- Password：パーソナルアクセストークンに設定（値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます）。
組み込みの接続文字列デザイナー

JDBC URL の作成には、Spark JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインからJAR ファイルを実行します。
```
java -jar cdata.jdbc.sparksql.jar
```
接続プロパティを入力し、接続文字列をクリップボードにコピーします。

一般的な接続文字列は次のとおりです。
```
jdbc:sparksql:Server=127.0.0.1;
```
接続をテストしてウィザードを完了します。Spark データソースを選択し、Enable をクリックします。