Open Delta Table・DB2 for i CDC・Reverse ETL - CData Sync Q3リリースで大幅な機能強化

by 宮本航太 | October 14, 2025

top

こんにちは、シニアプロダクトスペシャリストの宮本です!

CData Sync の2025年Q3リリースでは、モダンなレイクハウスからレガシーシステム、オペレーショナルシステムまで、以下の主要機能を追加しました:

今回のリリースのハイライト:

Open Delta Table をサポート - Amazon S3、Azure Blob Storage、Google Cloud Storage、Azure Data Lake Storage、およびMicrosoft Fabric OneLake(Open Mirroring経由) への対応

CDC機能の強化 - IBM DB2 AS400/iSeries とMySQL のサポート追加、全CDC ソースでハード削除トラッキングに対応

Reverse ETL拡張 - Sage Intacct(初のERP)、Veeva Vault CRM、Pardot、Salesforce Marketing Cloudを追加

Salesforce数式専用スキーマ - 計算フィールドのみをレプリケートする専用スキーマで、パフォーマンスとメンテナンス性を向上

それでは、各機能について詳しく見ていきましょう。

Open Delta Table をサポート

データファイルのクエリが遅い、スキーマが進化すると脆弱になる、複数のツールがアクセスしようとすると一貫性がなくなるなど、アナリティクスチームは多くの課題に直面しています。その結果、ダッシュボードが壊れたり、レポートが信頼できなくなったり、データを使いやすくするためだけに時間を浪費してしまうことがあります。

CData Sync の2025年Q3 リリースでは、主要なクラウドストレージの送信先において、オープンDelta Lake テーブルへのネイティブサポートでこの課題に対処しています。

Open Delta Tableは、データベースのACID信頼性をオープンファイル形式の柔軟性にもたらします。すべての書き込みはトランザクショナルであり、部分的なロードや破損したファイルはありません。スキーマの変更はテーブルレベルで強制・管理されるため、ソースシステムが進化しても、ダウンストリームのアナリティクスに一貫性が保たれます。Deltaはオープンスタンダードであるため、Syncで書き込まれたデータは、Databricks やFabric、Spark、Trino、Power BI に至るまで、さまざまなエンジンやBI ツールで即座にクエリできます。

今回のリリースにより、Sync はレイクハウスアーキテクチャに信頼性の高い基盤を提供します。クエリエンジンによる分析だけでなく、Delta サポートにより、Spark ベースの機械学習、複数データソースをまたぐ統合クエリ、TableauやPower BI などのBIツールでの可視化、そしてクリーンでバージョン管理されたデータに依存するAIトレーニングワークフローまで、一貫したパイプラインで実現できます。

Delta フォーマットでの出力方法について

S3やGCS などのストレージコネクタの接続設定画面にあるFile Format プロパティで、Delta Parquet を選択します。

output type

Linux 環境ではこれで準備は完了ですが、Windows 環境の場合だけ追加でHadoop のセットアップが必要です。
これはWindows OS だとHadoop バイナリが標準で含まれていないため、Hadoop のファイルAPI が利用できなくなるためです。Windows設定方法は以下のヘルプドキュメントに記載していますので参考にしてください。

https://cdn.cdata.com/help/ASM/jp/sync/Amazon-S3-Destination.html#prerequisites

環境準備が整いましたら、通常のジョブを作成する方法で行い、実行します。

replication

その結果、S3 にdelta テーブルとして実データがあるParquet ファイルとメタデータログが生成されます。

Delta parquet file

CDC などの差分連携時にも都度の全件更新ではないので有用です。ソース側のMySQL で1件更新を掛けてから実行すると、以下のように追加のParquetファイルが生成、メタデータログにもアクティビティログが保存されます。

実データのParquetファイル

Delta parquet file2

メタデータログ

metadata log

DB2 for i (AS400/iSeries) CDC対応とMySQL CDC強化

IBM DB2 AS400/iSeries とMySQL の両方に対応した新しいサポートにより、Sync はレガシーシステムとメインストリームデータベースにまたがる単一のプラットフォームとしての役割を強化し、お客様が個別の重厚なツールに依存することなくパイプラインを統合できるよう支援します。

今回のリリースは、今年初めに導入されたDB2 LUW のサポートを基盤として構築されており、DB2 ファミリーへの継続的な投資を示しています。MySQL のCDC 強化により、最も広く使用されているオープンソースデータベースの1つから、より高速で信頼性の高い増分レプリケーションが可能になります。

さらに、すべてのCDC ソースで新しくハード削除トラッキングが追加され、ダウンストリームシステムが手動でのクリーンアップなしに、真のソースオブレコードの状態を反映できるようになりました。

IBM DB2 AS400/iSeries でのCDC ジョブ設定について

設定方法は、まずDb2 for i 側でのジャーナルログ設定等が必要です。対応方法は以下のヘルプをご参照ください。
CData Sync - DB2 for i (Native) | 25.3.9414

次に、Db2 ネイティブドライバーをダウンロードして所定のパスに格納します。
パス:C:\Program Files\CData\CData Sync\lib

Db2 for i Native JDBC

その後Sync を起動させコネクタリストに移動し、「DB2 for I (Native)」を選択してコネクション設定します。

Db2 for i Native Connector

あとは実行いただければ、CDC エンジンが常にジャーナルログを参照して変更データをウォッチします。

ECDC

Reverse ETLの拡張

今回のリリースは、Sage Intacct を初のERP デスティネーションとして追加することで、Sync における Reverse ETLの重要な前進を示しています。

Reverse ETL をCRM やマーケティングを超えてERP に拡張することで、Sync は財務チームが信頼できるウェアハウスデータを中核的な会計システム内で直接活用できるようにします。これは、オペレーショナライズドデータの影響を拡大する新しい方向性です。

また、Veeva Vault CRM も追加され、ライフサイエンス分野に拡大し、製薬会社やバイオテクノロジー企業がアナリティクス対応データを規制されたコンテンツや顧客エンゲージメントのために依存しているシステムに直接プッシュバックできるようになりました。

マーケティング面では、SyncはPardot とSalesforce Marketing Cloud をサポートし、HubSpot のような既存のコネクタと連携して、マーケティングチームがウェアハウスからデータをアクティベーションする方法の選択肢を増やしています。

以下は、SyncのReverse ETL でサポートしているコネクタです:

Sources

Destinations

Snowflake

Salesforce

SQL Server

Dynamics365

Redshift

HubSpot

PostgreSQL

Zoho CRM

Oracle

Kintone

BigQuery

Pardot

Sage Intacct

Salesforce Marketing Cloud

Veeva Vault CRM

Salesforce数式専用スキーマ

Salesforce オブジェクトは、ほとんどのチームが触れることのない数千のカラムで肥大化していることで有名です。アナリストが実際に必要としているのは、数式やロールアップフィールド、つまりSalesforce 自体で定義されたKPI やビジネスロジックです。

Sync は、計算フィールドと主キーのみをレプリケートする専用のSalesforce_Formulas スキーマを提供するようになりました。

これにより、増分ジョブが無駄なく高速に保たれ、数式が独自のケイデンスで更新されます。Salesforce で新しく作成された数式は、手動での再マッピングなしに、ダウンストリーム に自動的に表示されます。

その結果、ノイズを除いたSalesforce のインテリジェンスをキャプチャしたクリーンなウェアハウススキーマが得られ、お客様はSalesforce データの配置方法を制御でき、ダウンストリームのアナリティクスが生のシステム肥大化ではなくビジネスロジックを反映することを保証します。

詳しい手順については以下の記事で説明しています。
CData Sync V25.3 Salesforce_Formulas でSalesforceの数式項目の同期を完璧に

最後に

CData Sync は30日間の無償トライアルが可能ですので、ぜひお試しください!
CData Sync | ノーコードで始めるETL / ELT パイプライン

ご不明な点やご質問がございましたら、お気軽にお問い合わせください。