【ノーコード】複数のRedshift アカウントのデータを簡単レプリケーション

宮本航太
プロダクトスペシャリスト

複数Redshift アカウント（sandbox/本番など）連携の複雑さをCData Sync でノーコード解決。テーブルprefix・スキーマ分離で環境別の管理も簡単、自動同期を実現する手順を詳解。

CData Sync は、いろいろなシナリオのデータレプリケーション（同期）を行うことができるスタンドアロンのアプリケーションです。例えば、sandbox および本番インスタンスのデータをデータベースに同期することができます。CData Sync のウェブインターフェースは複数のRedshift コネクションを簡単に管理できます。本記事では、複数のRedshift アカウントを一つのデータベースに同期する方法を説明します。

レプリケーションの同期先を設定

CData Sync では、Redshift のデータを何台のデータベースにでも複製できます。データベースはクラウドおよびオンプレミスの双方に対応しています。レプリケーションの同期先の設定には、［接続］タブから行います。

［同期先］タブを選択します。
同期先のアイコンをクリックします。本記事では、SQLite を使います。
必要な接続プロパティを入力します。Redshift をSQLite に複製するには、データソースボックスにファイルパスを指定します。
［接続のテスト］をクリックして、正しく接続できているかをテストします。
［変更を保存］をクリックします。

Redshift 接続の設定

データソース側にRedshift を設定します。［接続］タブをクリックします。

［接続の追加］セクションで［データソース］タブを選択します。
Redshift アイコンをデータソースとして選択します。プリインストールされたソースにRedshift がない場合には、追加データソースとしてダウンロードします。
接続プロパティに入力をします。

Amazon Redshift への接続

それでは、早速Amazon Redshift に接続していきましょう。データに接続するには、以下の接続パラメータを指定します。
- Server：Amazon Redshift データベースをホスティングしているサーバーのホスト名またはIP アドレス
- Database：Amazon Redshift クラスター用に作成したデータベース
- Port（オプション）：Amazon Redshift データベースをホスティングしているサーバーのポート。デフォルトは5439です
これらの値は、以下のステップでAWS マネージメントコンソールから取得できます。
1. Amazon Redshift コンソールを開きます（http://console.aws.amazon.com/redshift）
2. Clusters ページで、クラスター名をクリックしてください
3. Configuration タブの"Cluster Database Properties" セクションからプロパティを取得します。接続プロパティの値は、ODBC URL で設定された値と同じになります
Amazon Redshiftへの認証
CData 製品では幅広い認証オプションに対応しています。標準認証情報からIAM クレデンシャル、ADFS、Ping Federate、Microsoft Entra ID（Azure AD）、Azure AD PKCE まで利用可能です。
標準認証
ログイン資格情報を使用してAmazon Redshift に接続するには、以下のプロパティを設定してみましょう。
- AuthScheme：Basic
- User：認証するユーザーのログイン情報
- Password：認証するユーザーのパスワード
その他の認証方法については、ヘルプドキュメントをご確認ください。
［接続のテスト］をクリックして、正しく接続できているかをテストします。
［変更を保存］をクリックします。

それぞれのRedshift インスタンスのレプリケーションクエリの設定

Data Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。レプリケーションジョブ設定には、［ジョブ］タブに進み、［ジョブを追加］ボタンをクリックします。次にデータソースおよび同期先をそれぞれドロップダウンから選択します。レプリケーションジョブのソースおよび同期先を選択。

テーブル全体をレプリケーションする

テーブル全体をレプリケーションするには、［テーブル］セクションで［テーブルを追加］をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。.

テーブルをカスタマイズしてレプリケーションする

SQL クエリを使って、レプリケーションをカスタマイズできます。REPLICATE 構文はデータベースのテーブルにデータをキャッシュし、保存するハイレベルコマンドです。Redshift API がサポートするSELECT クエリを定義することができます。レプリケーションのカスタマイズにはテーブルセクションで［カスタムクエリの追加］をクリックして、クエリステートメントを記述します。

Redshift のデータのテーブルを差分更新でキャッシュするステートメントは次のとおり:

REPLICATE Orders;

使用するレプリケーションクエリを含むファイルを指定することで特定のデータベースを更新することが可能です。レプリケーションステートメントをセミコロンで区切ります。次のオプションは一つのデータベースに複数のRedshift アカウントのデータを同期する例です:

REPLICATE SELECT ステートメントで異なるtable prefix を使用する:
```
REPLICATE PROD_Orders SELECT * FROM Orders;
```
別の方法として、異なるスキーマを使うことも可能です:
```
REPLICATE PROD.Orders SELECT * FROM Orders;
```

レプリケーションのスケジュール起動

［スケジュール］セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。

レプリケーションジョブを設定したら、［変更を保存］します。このように複数のRedshift アカウントのデータを複製するジョブを作成することができました。

はじめる準備はできましたか？

詳細はこちら、または無料トライアルにお申し込みください：

CData Sync お問い合わせ

【ノーコード】複数のRedshift アカウントのデータを簡単レプリケーション

レプリケーションの同期先を設定

Redshift 接続の設定

Amazon Redshift への接続

Amazon Redshiftへの認証

標準認証

それぞれのRedshift インスタンスのレプリケーションクエリの設定

テーブル全体をレプリケーションする

テーブルをカスタマイズしてレプリケーションする

レプリケーションのスケジュール起動

はじめる準備はできましたか？

この記事の内容

関連記事