CloverDX(旧CloverETL)で Impala のデータ に接続

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
CloverDX データ統合ツールのビジュアルワークフローを使って Impala のデータ を転送。

CData JDBC Driver for Impala を使用すると、CloverDX(旧CloverETL)のデータ変換コンポーネントで Impala をソースおよびデスティネーションとして扱えます。この記事では、JDBC Driver for Impala を使用して、フラットファイルへのシンプルな転送を設定する方法を説明します。

JDBC データソースとして Impala に接続

  1. Impala のデータ への接続を作成します。新規のCloverDX グラフで、Outline ペインの「Connections」ノードを右クリックし、「Connections」->「Create Connection」をクリックします。Database Connection ウィザードが表示されます。
  2. プラスアイコンをクリックし、JAR からドライバーをロードします。インストールディレクトリのlib サブフォルダを参照し、cdata.jdbc.apacheimpala.jar ファイルを選択します。
  3. JDBC URL を入力します。

    Apache Impala に接続するには、ServerPort、およびProtocolVersion を設定してください。オプションでデフォルトのDatabase を指定することもできます。 NOSASL、LDAP、またはKerberos といった別の方法で接続するには、オンラインのヘルプドキュメントを参照してください。

    組み込みの接続文字列デザイナー

    JDBC URL の構築には、Impala JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから実行します。

    java -jar cdata.jdbc.apacheimpala.jar
    

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    一般的なJDBC URL は次のようになります:

    jdbc:apacheimpala:Server=127.0.0.1;Port=21050;

DBInputTable コンポーネントで Impala のデータ をクエリ

  1. Palette の「Readers」から「DBInputTable」をジョブフローにドラッグし、ダブルクリックして設定エディターを開きます。
  2. 「DB connection」プロパティで、ドロップダウンメニューから Impala JDBC データソースを選択します。
  3. SQL クエリを入力します。例:
    SELECT City, CompanyName FROM Customers WHERE Country = 'US'

クエリの出力をUniversalDataWriter に書き込む

  1. 「Writers」から「UniversalDataWriter」をジョブフローにドラッグします。
  2. UniversalDataWriter をダブルクリックして設定エディターを開き、ファイルURL を追加します。
  3. DBInputTable を右クリックし、「Extract Metadata」をクリックします。
  4. DBInputTable の出力ポートをUniversalDataWriter に接続します。
  5. UniversalDataWriter の「Select Metadata」メニューで、Customers テーブルを選択します。(このメニューはUniversalDataWriter の入力ポートを右クリックしても開けます。)
  6. 「Run」をクリックして、ファイルに書き込みます。

はじめる準備はできましたか?

Impala Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Impala Icon Impala JDBC Driver お問い合わせ

Impala に連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。