MySQL Workbench で HDFS のデータをクエリする方法

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
MySQL Workbench から HDFS のデータ にMySQL クエリを実行。

HDFS 用のODBC Driver のSQL Gateway を使用すると、MySQL インターフェースを通じて HDFS のデータ にクエリできます。以下の手順に従って、SQL Gateway のMySQL リモーティングサービスを起動し、MySQL Workbench でリアルタイムの HDFS のデータ を操作してみましょう。

HDFS のデータへの接続

まだ接続設定を行っていない場合は、データソース名(DSN)で必要な接続プロパティの値を入力してください。組み込みのMicrosoft ODBC データソースアドミニストレーターを使用してDSN を設定できます。これはドライバーインストールの最後のステップでもあります。Microsoft ODBC データソースアドミニストレーターを使用してDSN を作成・設定する方法については、ヘルプドキュメントの「はじめに」セクションを参照してください。

HDFS 接続プロパティの取得・設定方法

HDFS への認証には、次の接続プロパティを設定します。

  • Host:HDFS インスタンスのホストに設定。
  • Port:HDFS インスタンスのポートに設定。デフォルトのポートは"9870" です。

SQL Gateway の設定

SQL Gateway の概要を参照して、HDFS のデータ への接続を仮想MySQL データベースとしてセットアップしてください。クライアントからのMySQL リクエストをリッスンするMySQL リモーティングサービスを設定します。このサービスはSQL Gateway UI で設定できます。

SQL Gateway でMySQL リモーティングサービスを作成(Salesforce の例)

MySQL Workbench から HDFS をクエリ

以下の手順では、SQL Gateway で作成した仮想 HDFS データベースにMySQL Workbench から接続し、基本的なクエリを発行してリアルタイムの HDFS のデータ を操作する方法を説明します。

SQL Gateway 経由で HDFS に接続

  1. MySQL Workbench で、新しいMySQL 接続を追加するためにクリックします。
  2. 接続に名前を付けます(CData SQL Gateway for HDFS)。
  3. SQL Gateway に接続するためのHostnamePortUsername パラメータを設定します。
  4. Store in Vault をクリックしてパスワードを設定・保存します。
  5. Test Connection をクリックして接続が正しく設定されていることを確認し、OK をクリックします。

NOTE: Username および Password は、SQL Gateway 用に作成したユーザーの資格情報を指します。

HDFS のデータをクエリ

  1. 作成した接続(CData SQL Gateway for HDFS)を開きます。
  2. File -> New Query Tab をクリックします。
  3. SELECT * FROM `CData HDFS Sys`.Files; のようなSQL クエリを記述して HDFS のデータ を取得します。

MySQL Workbench からリアルタイムの HDFS のデータ にアクセスできるようになりました。MySQL データベースと同じ感覚で HDFS を簡単に操作できます。CData ODBC Driver for HDFS とCData SQL Gateway の30日間の無償トライアルをぜひお試しください。

はじめる準備はできましたか?

HDFS ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

HDFS Icon HDFS ODBC Driver お問い合わせ

HDFS ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからHDFS にデータ連携。

HDFS データにデータベースと同感覚でアクセスして、HDFS データに使い慣れたODBC インターフェースで連携。