JDBC で Elasticsearch データソースから Informatica マッピングを作成
Informatica は、データの転送と変換を行う強力でエレガントな手段を提供します。CData JDBC Driver for Elasticsearch を使用することで、業界で実績のある標準に基づいたドライバーにアクセスでき、Informatica の強力なデータ転送および操作機能とシームレスに統合できます。このチュートリアルでは、Informatica PowerCenter で Elasticsearch のデータ を転送および参照する方法を説明します。
Elasticsearch データ連携について
CData を使用すれば、Elasticsearch のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- SQL エンドポイントと REST エンドポイントの両方にアクセスでき、接続を最適化し、Elasticsearch データの読み書きに関してより多くのオプションを提供します。
- v2.2 以降およびオープンソース Elasticsearch サブスクリプションを含む、ほぼすべての Elasticsearch インスタンスに接続できます。
- SCORE() 関数を明示的に要求することなく、常にクエリ結果の関連性スコアを受け取ることができます。これにより、サードパーティツールからのアクセスが簡素化され、クエリ結果のテキスト関連性のランキングを簡単に確認できます。
- 複数のインデックスを検索でき、クライアントマシンではなく Elasticsearch がクエリと結果の管理・処理を担当します。
ユーザーは、Crystal Reports、Power BI、Excel などの分析ツールと Elasticsearch データを統合し、当社のツールを活用して、Elasticsearch を含むすべてのデータソースへの単一のフェデレートアクセスレイヤーを実現しています。
CData の Elasticsearch ソリューションの詳細については、ナレッジベース記事をご覧ください:CData Elasticsearch Driver Features & Differentiators
はじめに
ドライバーのデプロイ
ドライバーを Informatica PowerCenter サーバーにデプロイするには、インストールディレクトリの lib サブフォルダにある CData JAR ファイルと .lic ファイルを、次のフォルダにコピーします:Informatica インストールディレクトリ\services\shared\jars\thirdparty。
Developer ツールで Elasticsearch のデータ を使用するには、インストールディレクトリの lib サブフォルダにある CData JAR ファイルと .lic ファイルを、次のフォルダにコピーする必要があります:
- Informatica インストールディレクトリ\client\externaljdbcjars
- Informatica インストールディレクトリ\externaljdbcjars
JDBC 接続の作成
Informatica Developer から接続するには、次の手順に従います:
- Connection Explorer ペインで、ドメインを右クリックし、Create a Connection をクリックします。
- 表示される New Database Connection ウィザードで、接続の名前と ID を入力し、Type メニューで JDBC を選択します。
- JDBC Driver Class Name プロパティに、次のように入力します:
cdata.jdbc.elasticsearch.ElasticsearchDriver
- Connection String プロパティに、Elasticsearch の接続プロパティを使用して JDBC URL を入力します。
Elasticsearch 接続プロパティの取得・設定方法
接続するには、Server およびPort 接続プロパティを設定します。 認証には、User とPassword プロパティ、PKI (public key infrastructure)、またはその両方を設定します。 PKI を使用するには、SSLClientCert、SSLClientCertType、SSLClientCertSubject、およびSSLClientCertPassword プロパティを設定します。
CData 製品は、認証とTLS/SSL 暗号化にX-Pack Security を使用しています。TLS/SSL で接続するには、Server 値に'https://' を接頭します。Note: PKI を 使用するためには、TLS/SSL およびクライアント認証はX-Pack 上で有効化されていなければなりません。
接続されると、X-Pack では、設定したリルムをベースにユーザー認証およびロールの許可が実施されます。
組み込みの接続文字列デザイナー
JDBC URL の構築には、Elasticsearch JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。
java -jar cdata.jdbc.elasticsearch.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
一般的な接続文字列は次のとおりです:
jdbc:elasticsearch:Server=127.0.0.1;Port=9200;User=admin;Password=123456;
Elasticsearch テーブルの参照
ドライバー JAR をクラスパスに追加し、JDBC 接続を作成したら、Informatica で Elasticsearch エンティティにアクセスできます。Elasticsearch に接続してテーブルを参照するには、次の手順に従います:
- リポジトリに接続します。
- Connection Explorer で、接続を右クリックし、Connect をクリックします。
- Show Default Schema Only オプションのチェックを外します。
これで、Data Viewer で Elasticsearch テーブルを参照できます。テーブルのノードを右クリックし、Open をクリックします。Data Viewer ビューで、Run をクリックします。
Elasticsearch データオブジェクトの作成
プロジェクトに Elasticsearch テーブルを追加するには、次の手順に従います:
- Elasticsearch でテーブルを選択し、テーブルを右クリックして Add to Project をクリックします。
- 表示されるダイアログで、各リソースに対してデータオブジェクトを作成するオプションを選択します。
- Select Location ダイアログで、プロジェクトを選択します。
マッピングの作成
マッピングに Elasticsearch ソースを追加するには、次の手順に従います:
- Object Explorer で、プロジェクトを右クリックし、New -> Mapping をクリックします。
- Elasticsearch 接続のノードを展開し、テーブルのデータオブジェクトをエディターにドラッグします。
- 表示されるダイアログで、Read オプションを選択します。
Elasticsearch カラムをフラットファイルにマッピングするには、次の手順に従います:
- Object Explorer で、プロジェクトを右クリックし、New -> Data Object をクリックします。
- Flat File Data Object -> Create as Empty -> Fixed Width を選択します。
- Elasticsearch オブジェクトのプロパティで、必要な行を選択し、右クリックして copy をクリックします。フラットファイルのプロパティに行を貼り付けます。
- フラットファイルデータオブジェクトをマッピングにドラッグします。表示されるダイアログで、Write オプションを選択します。
- クリック&ドラッグでカラムを接続します。
Elasticsearch のデータ を転送するには、ワークスペース内で右クリックし、Run Mapping をクリックします。
