【ノーコード】複数のKafka アカウントのデータを簡単レプリケーション

宮本航太
プロダクトスペシャリスト

複数Kafka アカウント（sandbox/本番など）連携の複雑さをCData Sync でノーコード解決。テーブルprefix・スキーマ分離で環境別の管理も簡単、自動同期を実現する手順を詳解。

CData Sync は、いろいろなシナリオのデータレプリケーション（同期）を行うことができるスタンドアロンのアプリケーションです。例えば、sandbox および本番インスタンスのデータをデータベースに同期することができます。CData Sync のウェブインターフェースは複数のKafka コネクションを簡単に管理できます。本記事では、複数のKafka アカウントを一つのデータベースに同期する方法を説明します。

レプリケーションの同期先を設定

CData Sync では、Kafka のデータを何台のデータベースにでも複製できます。データベースはクラウドおよびオンプレミスの双方に対応しています。レプリケーションの同期先の設定には、［接続］タブから行います。

［同期先］タブを選択します。
同期先のアイコンをクリックします。本記事では、SQLite を使います。
必要な接続プロパティを入力します。Kafka をSQLite に複製するには、データソースボックスにファイルパスを指定します。
［接続のテスト］をクリックして、正しく接続できているかをテストします。
［変更を保存］をクリックします。

Kafka 接続の設定

データソース側にKafka を設定します。［接続］タブをクリックします。

［接続の追加］セクションで［データソース］タブを選択します。
Kafka アイコンをデータソースとして選択します。プリインストールされたソースにKafka がない場合には、追加データソースとしてダウンロードします。
接続プロパティに入力をします。

Apache Kafka 接続プロパティの取得・設定方法

それでは、Apache Kafka に接続していきましょう。.NET ベースのエディションは、Confluent.Kafka およびlibrdkafka ライブラリに依存して機能します。これらのアセンブリはインストーラーにバンドルされており、CData 製品と一緒に自動的にインストールされます。別のインストール方法をご利用の場合は、NuGet から依存関係のあるConfluent.Kafka 2.6.0をインストールしてください。

Apache Kafka サーバーのアドレスを指定するには、BootstrapServers パラメータを使用します。

デフォルトでは、CData 製品はデータソースとPLAINTEXT で通信しており、これはすべてのデータが暗号化なしで送信されることを意味します。通信を暗号化したい場合は、以下の設定を行ってください：
1. UseSSL をtrue に設定し、CData 製品がSSL 暗号化を使用するように構成します
2. SSLServerCert およびSSLServerCertType を設定して、サーバー証明書をロードします
Apache Kafka への認証

続いて、認証方法を設定しましょう。Apache Kafka データソースでは、以下の認証方法をサポートしています：
- Anonymous
- Plain
- SCRAM ログインモジュール
- SSL クライアント証明書
- Kerberos
Anonymous 認証

Apache Kafka の特定のオンプレミスデプロイメントでは、認証接続プロパティを設定することなくApache Kafka に接続できます。このような接続はanonymous（匿名）と呼ばれます。

匿名認証を行うには、以下のプロパティを設定してください。
- AuthScheme：None
その他の認証方法については、ヘルプドキュメントをご確認ください。
［接続のテスト］をクリックして、正しく接続できているかをテストします。
［変更を保存］をクリックします。

それぞれのKafka インスタンスのレプリケーションクエリの設定

Data Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。レプリケーションジョブ設定には、［ジョブ］タブに進み、［ジョブを追加］ボタンをクリックします。次にデータソースおよび同期先をそれぞれドロップダウンから選択します。レプリケーションジョブのソースおよび同期先を選択。

テーブル全体をレプリケーションする

テーブル全体をレプリケーションするには、［テーブル］セクションで［テーブルを追加］をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。.

テーブルをカスタマイズしてレプリケーションする

SQL クエリを使って、レプリケーションをカスタマイズできます。REPLICATE 構文はデータベースのテーブルにデータをキャッシュし、保存するハイレベルコマンドです。Kafka API がサポートするSELECT クエリを定義することができます。レプリケーションのカスタマイズにはテーブルセクションで［カスタムクエリの追加］をクリックして、クエリステートメントを記述します。

Kafka のデータのテーブルを差分更新でキャッシュするステートメントは次のとおり:

REPLICATE SampleTable_1;

使用するレプリケーションクエリを含むファイルを指定することで特定のデータベースを更新することが可能です。レプリケーションステートメントをセミコロンで区切ります。次のオプションは一つのデータベースに複数のKafka アカウントのデータを同期する例です:

REPLICATE SELECT ステートメントで異なるtable prefix を使用する:
```
REPLICATE PROD_SampleTable_1 SELECT * FROM SampleTable_1;
```
別の方法として、異なるスキーマを使うことも可能です:
```
REPLICATE PROD.SampleTable_1 SELECT * FROM SampleTable_1;
```

レプリケーションのスケジュール起動

［スケジュール］セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。

レプリケーションジョブを設定したら、［変更を保存］します。このように複数のKafka アカウントのデータを複製するジョブを作成することができました。

はじめる準備はできましたか？

詳細はこちら、または無料トライアルにお申し込みください：

CData Sync お問い合わせ

【ノーコード】複数のKafka アカウントのデータを簡単レプリケーション

レプリケーションの同期先を設定

Kafka 接続の設定

Apache Kafka 接続プロパティの取得・設定方法

Apache Kafka への認証

それぞれのKafka インスタンスのレプリケーションクエリの設定

テーブル全体をレプリケーションする

テーブルをカスタマイズしてレプリケーションする

レプリケーションのスケジュール起動

はじめる準備はできましたか？

この記事の内容

関連記事