RapidMiner からKafka のデータに連携

古川えりか
古川えりか
コンテンツスペシャリスト
Kafka をRapidMiner Studio の標準コンポーネント及びデータソース構成ウィザードと統合します。

この記事では、CData JDBC Driver for ApacheKafka をRapidMiner のプロセスと簡単に統合する方法を示します。この記事では、CData JDBC Driver for ApacheKafka を使用してKafka をRapidMiner のプロセスに転送します。

RapidMiner のKafka にJDBC Data Source として接続する

以下のステップに従ってKafka へのJDBC 接続を確認できます。

  1. Kafka 用の新しいデータベースドライバーを追加します。[Connections]->[Manage Database Drivers]とクリックします。
  2. 表示されるウィザードで[Add]ボタンをクリックし、接続に名前を入力します。
  3. JDBC URL のプレフィックスを入力します。
    jdbc:apachekafka:
    
  4. インストールディレクトリのlib サブフォルダにあるcdata.jdbc.apachekafka.jar ファイルにパスを入力して下さい。
  5. ドライバークラスを入力します。
    cdata.jdbc.apachekafka.ApacheKafkaDriver
    
    The JDBC driver configuration.(Salesforce is shown.)
  6. 新しいKafka 接続を作成します。[Connections]->[Manage Database Connections]とクリックします。
  7. 接続の名前を入力します。
  8. データベースシステムの場合は、以前構成したKafka ドライバーを選択します。
  9. Host ボックスで接続文字列を入力します。

    Apache Kafka 接続プロパティの取得・設定方法

    それでは、Apache Kafka に接続していきましょう。.NET ベースのエディションは、Confluent.Kafka およびlibrdkafka ライブラリに依存して機能します。 これらのアセンブリはインストーラーにバンドルされており、CData 製品と一緒に自動的にインストールされます。 別のインストール方法をご利用の場合は、NuGet から依存関係のあるConfluent.Kafka 2.6.0をインストールしてください。

    Apache Kafka サーバーのアドレスを指定するには、BootstrapServers パラメータを使用します。

    デフォルトでは、CData 製品はデータソースとPLAINTEXT で通信しており、これはすべてのデータが暗号化なしで送信されることを意味します。 通信を暗号化したい場合は、以下の設定を行ってください:

    1. UseSSLtrue に設定し、CData 製品がSSL 暗号化を使用するように構成します
    2. SSLServerCert およびSSLServerCertType を設定して、サーバー証明書をロードします

    Apache Kafka への認証

    続いて、認証方法を設定しましょう。Apache Kafka データソースでは、以下の認証方法をサポートしています:

    • Anonymous
    • Plain
    • SCRAM ログインモジュール
    • SSL クライアント証明書
    • Kerberos

    Anonymous 認証

    Apache Kafka の特定のオンプレミスデプロイメントでは、認証接続プロパティを設定することなくApache Kafka に接続できます。 このような接続はanonymous(匿名)と呼ばれます。

    匿名認証を行うには、以下のプロパティを設定してください。

    • AuthSchemeNone

    その他の認証方法については、ヘルプドキュメントをご確認ください。

    ビルトイン接続文字列デザイナ

    JDBC URL の構成については、Kafka JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。

    java -jar cdata.jdbc.apachekafka.jar
    

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    Using the built-in connection string designer to generate a JDBC URL (Salesforce is shown.)

    以下は一般的な接続文字列です。

    User=admin;Password=pass;BootStrapServers=https://localhost:9091;Topic=MyTopic;
    
  10. 必要であればユーザー名とパスワードを入力します。 The connection to the JDBC data source.(Salesforce is shown.)

プロセス内の様々なRapidMiner オペレーターとのKafka 接続を使用できます。Kafka を取得するには、[Operators]ビューから[Retrieve]をドラッグします。 A Retrieve operation to select data.(Salesforce is shown.) [Retrieve]オペレータを選択した状態で、[repository entry]の横にあるフォルダアイコンをクリックして[Parameters]ビューで取得するテーブルを定義できます。表示されるRepository ブラウザで接続ノードを展開し、目的のサンプルセットを選択できます。

The Repository Browser window you can use to select an example set.(Salesforce is shown.)

最後に、[Retrieve]プロセスから結果に出力をワイヤリングし、プロセスを実行してKafka を確認します。

The results of the Retrieve operation.(Salesforce is shown.)

はじめる準備はできましたか?

Apache Kafka Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Kafka Icon Apache Kafka JDBC Driver お問い合わせ

Apache Kafka データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。