RunMyProcess DSEC を使用して DigitalSuite Studio で Spark のデータ に接続

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Arkobi Digital のローコードクラウドネイティブプラットフォーム RunMyProcess の DigitalSuite EnterpriseConnect(DSEC)を使用して Spark に接続します。

CData JDBC Driver for Spark は JDBC 標準を実装しており、BI からIDE まで幅広いアプリケーションから Spark への接続を可能にします。この記事では、Arkobi Digital RunMyProcess の DSEC から Spark のデータ に接続し、RunMyProcess で Spark に接続する方法を説明します。

EnterpriseConnect Agent のセットアップ

RunMyProcess ドキュメントの EnterpriseConnect ページに従って、EnterpriseConnect Agent を設定します。

JDBC Adapter のセットアップ

JDBC Adapter のセクションでは、JDBC を使用して RDBMS に接続する手順が説明されています。手順に従って JDBC.config ファイルを開きます。

  1. CData JDBC Driver for Spark 用の JSON エントリを作成します。例:
    SparkSQL = {
      "sqlDriver" : "...",
      "sqlSource" : "...",
      "sqlDriverPath" : "..."
    }
    
  2. "sqlDriver" フィールドに CData JDBC Driver のクラス名を設定します。例:
    cdata.jdbc.sparksql.SparkSQLDriver
  3. "sqlSource" フィールドに Spark に接続するための JDBC URL を設定します。例:
    jdbc:sparksql:Server=127.0.0.1;

    組み込みの接続文字列デザイナー

    JDBC URL の作成には、Spark JDBC Driver に組み込まれている接続文字列デザイナーをご利用ください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。

    java -jar cdata.jdbc.sparksql.jar
    

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。
  4. "sqlDriverPath" フィールドに CData JDBC Driver JAR ファイルの名前を設定します。例:
    cdata.jdbc.sparksql.jar

JDBC.config ファイルの例

#DBAgent Configuration
SparkSQL = {"sqlDriver" : "cdata.jdbc.sparksql.SparkSQLDriver", "sqlSource" = "jdbc:sparksql:Server=127.0.0.1;","sqlDriverPath" = "cdata.jdbc.sparksql.jar" }

JDBC ドライバー JAR ファイル(cdata.jdbc.sparksql.jar)を unified-adapter-[version].jar と同じディレクトリに配置します。

注意:CData ライセンスファイル(cdata.jdbc.sparksql.lic)も同じディレクトリに配置してください。ライセンスは製品がインストールされているマシンの一意の識別子に基づいて生成されるため、ファイルを別のマシンに配置する場合はオフラインアクティベーションが必要になります。

DigitalSuite EnterpriseConnect Agent の起動

Windows では、Windows サービスから RunMyProcess DigitalSuite EnterpriseConnect Agent を起動します。コマンドラインでアプリケーションを起動する場合は、RunMyProcess ドキュメントの Starting the EnterpriseConnect Agent を参照してください。

JDBC Adapter の起動

runAdapter.bat から JDBC Adapter を起動します。Adapter が起動したら、エージェントアドレス(例:127.0.0.1:8080)を通じてアプリケーションにアクセスできます。以下は Windows でコマンドを実行した例です。

... > java -Djava.util.logging.config.file=./log.properties -cp lib/* org.runmyprocess.sec2.AdapterHandler :
2021-06-09 14:37:58|INFO|correlationId=|Searching for config file...
2021-06-09 14:37:58|INFO|correlationId=|Adapter Handler started with [JDBC] configuration
2021-06-09 14:37:59|INFO|correlationId=|agent address: 127.0.0.1:8080
2021-06-09 14:38:00.251:INFO::ConnectionThread: Logging initialized @1820ms to org.eclipse.jetty.util.log.StdErrLog
2021-06-09 14:38:00|INFO|correlationId=|onConnect() websocket connection between Agent and Adapter established

DigitalSuite EnterpriseConnect Agent と JDBC Adapter が起動したら、ブラウザで http://localhost:(指定したポート番号)/ にアクセスして、以下のページを開きます。

Postman や cURL などのツールを使用して JDBC Adapter の接続確認を行います。ここでは Postman を使用して HTTP POST リクエストを送信します。

RequestHeader を以下のように設定します:

Content-Type application/json

RequestBody を以下のように設定します:

{
	"protocol":"JDBC",
	"data":{
		"DBType":"SparkSQL",
		"sqlUsername":"",
		"sqlPassword":"",
		"sqlStatement":"SELECT * FROM Customers"
	}
}

JDBC.config ファイルに認証情報が含まれている場合、sqlUsername と sqlPassword は空のままにできます。テーブル名が不明な場合は、SELECT * FROM sys_tables リクエストを使用してテーブルの一覧を取得できます。

ステータスが 200 で、ボディに JSON 形式の Spark のデータ データが含まれていれば、リクエストは成功です。

DigitalSuite Studio で DSEC Agent を介して Spark に接続

DigitalSuite Studio プロジェクトを作成し、プロジェクト内に Provider を作成します。

  • URL:JDBC Agent にアクセスするための URL(例:http:localhost:8080/)
  • Authentication Scheme:Login/password
  • Loginapplication.properties ファイルの agent.user の値
  • Passwordapplication.properties ファイルの agent.password の値
  • Secured:チェックを入れる
  • Use DigitalSuite EnterpriseConnect:チェックを入れる
  • With domainapplication.properties ファイルの agent.domain の値

次に、Provider 内に Connector を作成します。

  • Connector URL:空のままにする
  • Architecture:REST/XML-RPC
  • Method:POST
  • Result format:JSON
  • Accept media type:application/json
  • Character set:Automatic
  • Content:JDBC Adapter で使用した Request body と同じ内容
  • Content type: application/json

JDBC Adapter で Request body として使用した JSON データ:

{
	"protocol":"JDBC",
	"data":{
		"DBType":"SparkSQL",
		"sqlUsername":"",
		"sqlPassword":"",
		"sqlStatement":"SELECT * FROM Customers"
	}
}

Launch Test を開いてテストを実行します。右側のペインの Result に Spark のデータ データが表示されれば、テストは成功です。

これで、DSEC を介して RunMyProcess DigitalSuite Studio で Spark のデータ を使用できるようになりました。

サポートされる SQL コマンドの詳細については、ヘルプドキュメントの「SQL Compliance」セクションを参照してください。テーブルの詳細については、「Data Model」セクションを参照してください。

はじめる準備はできましたか?

Apache Spark Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Spark Icon Apache Spark JDBC Driver お問い合わせ

Apache Spark 連携のパワフルなJava アプリケーションを素早く作成して配布。