MySQL Workbench で HDFS のデータをクエリする方法
HDFS 用のODBC Driver のSQL Gateway を使用すると、MySQL インターフェースを通じて HDFS のデータ にクエリできます。以下の手順に従って、SQL Gateway のMySQL リモーティングサービスを起動し、MySQL Workbench でリアルタイムの HDFS のデータ を操作してみましょう。
HDFS のデータへの接続
まだ接続設定を行っていない場合は、データソース名(DSN)で必要な接続プロパティの値を入力してください。組み込みのMicrosoft ODBC データソースアドミニストレーターを使用してDSN を設定できます。これはドライバーインストールの最後のステップでもあります。Microsoft ODBC データソースアドミニストレーターを使用してDSN を作成・設定する方法については、ヘルプドキュメントの「はじめに」セクションを参照してください。
HDFS 接続プロパティの取得・設定方法
HDFS への認証には、次の接続プロパティを設定します。
- Host:HDFS インスタンスのホストに設定。
- Port:HDFS インスタンスのポートに設定。デフォルトのポートは"9870" です。
SQL Gateway の設定
SQL Gateway の概要を参照して、HDFS のデータ への接続を仮想MySQL データベースとしてセットアップしてください。クライアントからのMySQL リクエストをリッスンするMySQL リモーティングサービスを設定します。このサービスはSQL Gateway UI で設定できます。

MySQL Workbench から HDFS をクエリ
以下の手順では、SQL Gateway で作成した仮想 HDFS データベースにMySQL Workbench から接続し、基本的なクエリを発行してリアルタイムの HDFS のデータ を操作する方法を説明します。
SQL Gateway 経由で HDFS に接続
- MySQL Workbench で、新しいMySQL 接続を追加するためにクリックします。
- 接続に名前を付けます(CData SQL Gateway for HDFS)。
- SQL Gateway に接続するためのHostname、Port、Username パラメータを設定します。
- Store in Vault をクリックしてパスワードを設定・保存します。
- Test Connection をクリックして接続が正しく設定されていることを確認し、OK をクリックします。
NOTE: Username および Password は、SQL Gateway 用に作成したユーザーの資格情報を指します。
HDFS のデータをクエリ
- 作成した接続(CData SQL Gateway for HDFS)を開きます。
- File -> New Query Tab をクリックします。
- SELECT * FROM `CData HDFS Sys`.Files; のようなSQL クエリを記述して HDFS のデータ を取得します。
MySQL Workbench からリアルタイムの HDFS のデータ にアクセスできるようになりました。MySQL データベースと同じ感覚で HDFS を簡単に操作できます。CData ODBC Driver for HDFS とCData SQL Gateway の30日間の無償トライアルをぜひお試しください。