BIRT でSpark のデータのレポートを作成

Jerod Johnson
Senior Technology Evangelist

組み込み分析にリアルタイムSpark のデータを提供。

CData JDBC Driver for Spark は、データドリブンな Java アプリケーションにSpark API への接続機能を統合します。CData JDBC Driver for Spark を BIRT（Business Intelligence Reporting Tools）プラットフォームと組み合わせることで、データの変更をリアルタイムに反映する BIRT レポートを作成できます。

まだインストールしていない場合は、BIRT Framework プラグインと Database Development プラグインを Eclipse にインストールします。
「File」->「New」->「Report」をクリックします。Report Design パースペクティブが開きます。
Data Explorer で「Data Sources」を右クリックし、「New Data Source」をクリックします。
「Create from a Data Source Type in the Following List」オプションを選択し、「JDBC Data Source」を選択します。
「Manage Drivers」をクリックし、インストールフォルダの lib サブフォルダにあるドライバー JAR を追加します。
「Database URL」ボックスに、接続文字列を含む JDBC URL を入力します。
SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。
- Server：SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
- Port：SparkSQL インスタンスへの接続用のポートに設定。
- TransportMode：SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme：使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note：必要な値は、「クラスター」に移動して目的のクラスターを選択し、「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
- Server：Databricks クラスターのサーバーのホスト名に設定。
- Port：443
- TransportMode：HTTP
- HTTPPath：Databricks クラスターのHTTP パスに設定。
- UseSSL：True
- AuthScheme：PLAIN
- User：'token' に設定。
- Password：パーソナルアクセストークンに設定（値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます）。
組み込みの接続文字列デザイナー

JDBC URL の構築には、Spark JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行してください。
```
java -jar cdata.jdbc.sparksql.jar
```
接続プロパティを入力し、接続文字列をクリップボードにコピーします。

JDBC URL を設定する際、Max Rows 接続プロパティも設定しておくと良いでしょう。返される行数が制限されるため、レポートやビジュアライゼーションの設計時のパフォーマンスが向上します。

一般的な JDBC URL は以下のとおりです：
```
jdbc:sparksql:Server=127.0.0.1;
```
「Data Sets」フォルダを右クリックし、Spark用の JDBC データソースを選択します。
表示されるダイアログで、レポート用のデータを取得する SELECT クエリを作成します。この記事では以下のクエリを使用します：
```
SELECT City, Balance FROM Customers
```
「Palette」からエディターにチャートをドラッグします。チャートウィザードが表示されます。
チャートタイプを選択した後、「Select Data」タブでカラムをチャートフィールドにドラッグします。
「Run」->「View Report」->「In Web Viewer」をクリックしてレポートを表示します。

これで、BIRT レポートがSpark のデータの更新を反映できるようになりました。オンデマンドで更新できる BIRT レポート（画像は Salesforce の例）

レポートをアプリケーションサーバーに公開するには、ドライバー JAR を BIRT Viewer のクラスパスに追加します。詳細については、Java アプリケーションサーバーへの JDBC ドライバのデプロイに関する CData KB ガイドを参照してください。

はじめる準備はできましたか？

Apache Spark Driver の無料トライアルをダウンロードしてお試しください：

ダウンロード

詳細：

Apache Spark JDBC Driver お問い合わせ

Apache Spark 連携のパワフルなJava アプリケーションを素早く作成して配布。

BIRT でSpark のデータのレポートを作成

SparkSQL への接続

Databricks への接続

組み込みの接続文字列デザイナー

はじめる準備はできましたか？

この記事の内容

関連記事