PHP でMySQL からSpark のデータにアクセス
CData SQL Gateway とODBC Driver for SparkSQL を使用することで、ETL を実行したりデータをキャッシュしたりすることなく、MySQL クライアントからSpark にアクセスできます。以下のステップに従って、PHP の標準MySQL インターフェースであるmysqli とPDO_MySQL を介してSpark のデータにリアルタイムで接続します。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- Spark をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにSpark のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてSpark の接続を設定、2.MySQL 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData ODBC ドライバのインストールとSpark への接続設定
まずは、本記事右側のサイドバーからSparkSQL ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
必要な接続プロパティの値が未入力の場合には、データソース名(DSN)で入力します。組み込みのMicrosoft ODBC Data Source Administrator を使用し、DSN を構成できます。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC データソースアドミニストレーターを使ってDSN を作成および設定する方法は、ヘルプドキュメントの「はじめに」を参照してください。
SparkSQL への接続
SparkSQL への接続を確立するには以下を指定します。
- Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
- Port:SparkSQL インスタンスへの接続用のポートに設定。
- TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
Databricks への接続
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
- Server:Databricks クラスターのサーバーのホスト名に設定。
- Port:443
- TransportMode:HTTP
- HTTPPath:Databricks クラスターのHTTP パスに設定。
- UseSSL:True
- AuthScheme:PLAIN
- User:'token' に設定。
- Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。
SQL Gateway を構成する
Spark のデータへの接続を、仮想MySQL データベースとして設定する方法については、「SQL Gateway Overview」を参照してください。クライアントからのMySQL リクエストをリッスンするMySQL リモートサービスを構成します。このサービスはSQL Gateway UI で設定できます。

PHP から接続する
以下の例は、オブジェクト指向インターフェースを使用してクエリを接続および実行する方法を示します。 以下のパラメータを使用して接続オブジェクトを初期化し、仮想MySQL データベースに接続します。
- Host:サービスが実行されているリモートホストの場所を指定します。この例では、サービスがローカルマシンで実行されているため、"localhost" をリモートホスト設定に使用します。
- Username:SQL Gateway の「ユーザー」タブで認証したユーザーのユーザー名を指定します。
- Password:認証されたユーザーアカウントのパスワードを指定します。
- Database Name:データベース名としてシステムDSN を指定します。
- Port:サービスが実行されているポートを指定します。この例では3306 を指定します。
mysqli
<?php
$mysqli = new mysqli("localhost", "user", "password", "CData SparkSQL Sys","3306");
?>
PDO
<?php
$pdo = new PDO('mysql:host=localhost;dbname=CData SparkSQL Sys;port=3306', 'user', 'password');
?>
PHP からクエリする
接続が確立されると、テーブルにアクセスできます。以下のステップでは、例を説明します。
- テーブル(Customers)をクエリします。結果は、連想配列として$result オブジェクトに保存されます。
- 各行とカラムを順番に処理して、値を出力してPHP ページに表示することができます。
- 接続を閉じます。
mysqli
$result = $mysqli->query("SELECT City, Balance FROM Customers");
while($row = $result->fetch_assoc()) {
foreach ($row as $k=>$v) {
echo "$k : $v";
echo "<br />";
}
}
$mysqli->close();
PDO
$result = $pdo->query("SELECT City, Balance FROM Customers");
while($row = $result->fetch(PDO::FETCH_ASSOC)) {
foreach ($row as $k=>$v) {
echo "$k : $v";
echo "<br />";
}
}
$result = null;
$pdo = null;
おわりに
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。