
こんにちは。CData Software Japan の色川です。
先日リリースされたCData Arc 2025.Q2(25.2)アップデートでは、「B2B 連携をもっとシンプルに」をコンセプトにするArc に相応しく、新コネクタの搭載や主要コネクタの機能強化により「応用的な連携シナリオでも、もっとシンプルに」構成できるように進化しています。
Arc 25.2 でリリースされた数多くのアップデートの中で「応用的な連携シナリオでも、もっとシンプルに」実現する新機能の1つが、新しく搭載された「Encoding コネクタ」です。この記事では、Arc 25.2 で新しく搭載された「Encoding コネクタ」についてご紹介します。
CData Arc での文字コードの扱い
日本語などのマルチバイト文字圏でのデータ連携において課題になりがちな1つに文字コードがあります。昨今のモダンな業務アプリケーションやプラットフォームでは、UTF-8 などのUnicode に準拠したエンコーディングが採用されることが多いと思いますが、連携先のプラットフォームやアプリケーション、データフォーマットなどによってはShift_JIS やEUC-JP などを筆頭に、現在でも様々なエンコーディングが利用されています。
CData Arc のフローでは内部的に処理するデータの文字コードを「UTF-8」で扱います。UTF-8 は世界的にも最もポピュラーな文字コードで、多くのソフトウェアやサービスで標準的に採用されている文字コードです。ファイルベースの連携において、連携元がUTF-8 以外でエンコーディングされたファイルを提供する場合、もしくは連携先がUTF-8 以外でエンコーディングされたファイルを要求する場合、連携フローの中でエンコーディングの変換(文字コード変換)が必要です。
B2B 連携で利用されることが多いArc では、従来から文字コード変換を含んだ連携シナリオで活用いただく事も多く、ArcScript のfileRead / fileWrite オペレーションなどを活用すれば任意のエンコーディング変換を実現することができます。また、Flat File コネクタなどファイル形式(フォーマット)を扱う時に変換元のエンコーディングを指定することもサポートされています。
今回のアップデートでは、これら従来までの機能に加え、エンコーディング変換専用の「Encoding コネクタ」が新たに追加されました。新しく追加された「Encoding コネクタ」は、処理対象ファイルの文字エンコーディングを自動検出(Auto-Detect)し、指定した出力エンコーディングへ変換するための専用コネクタです。UTF-8 / UTF-16やShift-JIS、EUC-JP、Big5、GBKなど、多言語・多国地域の文字コードに対応しています。

従来までのArcScript などを利用するエンコーディング変換(文字コード変換)処理と比べ、エンコーディングの自動検出を含めた豊富な機能を、ノーコードでフローに組み込める点が特長です。Encoding コネクタを利用することで、文字コードの課題を含むような応用的な連携シナリオでも「もっとシンプルに」実現することができるようになっています。
Encoding コネクタ
今回のアップデートで新しく搭載された「Encoding コネクタ」は、Arc のコアコネクタ(Core Connectors)の1つとしてラインナップに加わりました。Arc のコアコネクタは全てのライセンスエディションで無制限で利用できる基本的なコネクタ群です。
Encoding コネクタは、エンコーディングの自動検出を備えた高機能なコネクタですが、設定や利用方法はとてもシンプルです。基本的なコネクタ設定は以下の4項目で構成されます。

プロパティ | 内容 |
インプットエンコーディング | 変換元となるインプットファイルのエンコーディングを指定するプロパティ。デフォルトは「Auto-Detect(自動検出)」です。 |
自動検出フォールバック | Auto-Detect(自動検出)によるインプットファイルのエンコーディング検出に失敗した場合の振舞いを指定するプロパティ。デフォルトは「Use Fallback Encoding(フォールバックエンコーディングで指定されたエンコーディングを使用する)」です。それ以外に「Keep Original(インプットファイルのエンコーディングを保持する)」と「Failure(エラーとして扱う)」の振舞いを指定することができます。 |
フォールバックエンコーディング | Auto-Detect(自動検出)によるインプットファイルのエンコーディング検出が失敗して、自動検出フォールバックが「Use Fallback Encoding」に指定されている場合に、利用するエンコーディングを指定するプロパティ。 |
アウトプットエンコーディング | 変換先となるアウトプットファイルに適用するエンコーディングを指定するプロパティ。 |
インプットエンコーディングなどエンコーディングを選択できるプロパティでは、UTF-8 / UTF-16 やISO-8859-1(Latin-1)などグローバルで幅広く利用されているエンコーディングはもちろん、Shift-JIS やEUC-JP など日本語圏で広く利用されているエンコーディングや、GB2312 / GBK / Big5 など中国語圏で広く利用されているエンコーディングなどがGUI で選択できるようになっています。

また、デフォルトで選択肢として構成されているエンコーディング以外を明示的に指定したい場合、「その他の設定」に指定することで、Custom Value として選択・構成することもできます。

このように、エンコーディングの自動検出や振舞いの制御も備える高機能なEncoding コネクタですが、連携元がUTF-8 以外でエンコーディングされたファイルを提供するシーンであれば、多くのケースではデフォルトの設定(インプットファイルのエンコーディングは自動検出、アウトプットファイルのエンコーディングはUTF-8)で期待の結果が得られるでしょう。また、連携先がUTF-8 以外でエンコーディングされたファイルを要求するシーンであれば、アウトプットエンコーディングを選択することで期待の結果が得られると思います。
CData Arc では、フローを流れるメッセージ(メッセージファイル、処理対象データ)に対して、処理状況や状態の識別に有用なさまざまなメッセージヘッダーが付与されますが、Encoding コネクタで処理したメッセージには「Original-Encoding」などのメッセージヘッダーが付与され、後続のコネクタでその情報を確認・活用することもできます。

その他
Arc に新しく搭載された「Encoding コネクタ」は、文字コード変換をサポートする強力な専用コネクタです。なお、Arc 25.2 のEncoding コネクタはベータリリースです。ベータ期間終了後は25.3 以降へのアップデートが必要です。
また、B2B データのエンコードといったときに、Base64 など符号化(データ変換方式)の意味でのエンコーディング(Encoding)を想像される方もいるかも知れません。Arc のEncoding コネクタは文字コード変換としてのエンコードをサポートします。Base64 など符号化の意味でのエンコードやデコードについては、encEncode / encDecode オペレーションなどを利用することができます。
まとめ
この記事ではCData Arc 2025.Q2(25.2)アップデートで新しく搭載された「Encoding コネクタ」についてご紹介しました。
今回のArc 25.2 では「応用的な連携シナリオも、もっとシンプルに」実現できる、数多くのアップデートを実施していますが、日本語などのマルチバイト文字圏でのデータ連携において課題になりがちな文字コードの課題を含むシナリオは「応用的で高度な連携シナリオ」の1つと言えるかも知れません。
CData Arc 25.2 では、他にも多くの機能強化・機能改善が施されています。詳しく知りたい方はリリースノートをあわせてごらんください。数多くのアップデートで、より使いやすくなったCData Arc をぜひ試してみてください。
CData Arc - セキュアなデータ連携とマネージドファイル転送(MFT)
今回リリースされた新たなバージョンに限らず、今ご利用されているバージョンについても、設定や利用方法などご不明な点があれば、お気軽にテクニカルサポートまでお問い合わせください。
CData Software Japan - Support Form
この記事では CData Arc™ 2025 - 25.2.9349.0 を利用しています