Talend Cloud Data Management Platform で Snowflake のデータ を連携
Qlik 社の Talend Cloud Data Management Platform は多様なデータ環境をサポートし、スマートな意思決定のための分析、業務データの共有、データおよびアプリケーションのモダナイゼーション、リスク低減のためのデータエクセレンスの確立を実現します。CData JDBC Driver for Snowflake と組み合わせると、Snowflake のデータ のデータ連携、品質管理、ガバナンスを向上できます。この記事では、Talend Cloud Data Management で CData JDBC Driver を使用して Snowflake に接続し、ワークフロー内でデータを同時に利用できるようにする方法を説明します。
Snowflake データ連携について
CData は、Snowflake のライブデータへのアクセスと統合を簡素化します。お客様は CData の接続機能を以下の目的で活用しています:
- Snowflake データを迅速かつ効率的に読み書きできます。
- 指定された Warehouse、Database、Schema のメタデータを動的に取得できます。
- OAuth、OKTA、Azure AD、Azure マネージド サービス ID、PingFederate、秘密鍵など、さまざまな方法で認証できます。
多くの CData ユーザーは、CData ソリューションを使用して、お気に入りのツールやアプリケーションから Snowflake にアクセスし、さまざまなシステムからデータを Snowflake にレプリケートして、包括的なウェアハウジングと分析を行っています。
CData ソリューションとの Snowflake 統合についての詳細は、ブログをご覧ください:https://jp.cdata.com/blog/snowflake-integrations
はじめに
前提条件
CData JDBC Driver を使用して Talend Cloud Data Management Platform でデータを表示・操作する前に、システムに最新バージョンの Talend Studio をダウンロードしてインストールしてください。また、以下の前提条件を満たしていることを確認してください。
- 適切な権限を持つ Talend Cloud Data Management アカウント
- CData Web サイトからダウンロード可能な CData JDBC Driver for Snowflake
Talend で Snowflake に JDBC データソースとして接続
Talend Data Management Cloud へのアクセス
- ローカルシステムにインストールされている Talend Cloud Data Management Platform を起動し、Other Login Mode をクリックします。
- Manage Connections をクリックします。Repository を「Local」に設定し、Name、Description、User E-mail を入力します。Workspace のパスを設定して OK をクリックします。
- Create a new project ラジオボタンを選択して新しいプロジェクト名を追加し、Create をクリックします。
- 新しいプロジェクトが Select an existing project セクションに表示されます。Open をクリックします。Talend Cloud Data Management Platform ワークスペースが開きます。
新しい接続の作成
- ナビゲーションペインで Metadata ドロップダウンを展開します。Db Connections を右クリックし、Create Connection を選択します。
- Database Connection ウィンドウの Find セクションで「JDBC」を検索して選択します。次に、Finish をクリックします。
- Snowflake のデータ をロードする Talend の新しいデータベースの Name、Purpose、Description を入力します。Next をクリックします。
- Snowflake に接続するための JDBC URL を生成します。jdbc:snowflake: で始まり、セミコロンで区切られた一連の接続文字列プロパティを続けます。
それでは、Snowflake データベースに接続していきましょう。認証に加えて、以下の接続プロパティを設定します。
- Url:お使いのSnowflake URL を指定します。例:https://orgname-myaccount.snowflakecomputing.com
- Legacy URL を使用する場合:https://myaccount.region.snowflakecomputing.com
- ご自身のURL は以下のステップで確認できます。
- Snowflake UI の左下にあるユーザー名をクリックします
- Account ID にカーソルを合わせます
- Copy Account URL アイコンをクリックして、アカウントURL をコピーします
- Database(オプション):CData 製品によって公開されるテーブルとビューを、特定のSnowflake データベースのものに制限したい場合に設定します
- Schema(オプション):CData 製品によって公開されるテーブルとビューを、特定のSnowflake データベーススキーマのものに制限したい場合に設定します
Snowflakeへの認証
CData 製品では、Snowflake ユーザー認証、フェデレーション認証、およびSSL クライアント認証をサポートしています。認証するには、User とPassword を設定し、AuthScheme プロパティで認証方法を選択してください。
キーペア認証
ユーザーアカウントに定義されたプライベートキーを使用してセキュアなトークンを作成し、キーペア認証で接続することも可能です。この方法で接続するには、AuthScheme をPRIVATEKEY に設定し、以下の値を設定してください。
- User:認証に使用するユーザーアカウント
- PrivateKey:プライベートキーを含む.pem ファイルへのパスなど、ユーザーに使用されるプライベートキー
- PrivateKeyType:プライベートキーを含むキーストアの種類(PEMKEY_FILE、PFXFILE など)
- PrivateKeyPassword:指定されたプライベートキーのパスワード
その他の認証方法については、ヘルプドキュメントの「Snowflakeへの認証」セクションをご確認ください。
組み込みの接続文字列デザイナー
JDBC URL の構築には、Snowflake JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。
java -jar cdata.jdbc.snowflake.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
一般的な JDBC URL は次のようになります。
jdbc:snowflake:User=Admin;Password=test123;Server=localhost;Database=Northwind;Warehouse=TestWarehouse;Account=Tester1;
- Url:お使いのSnowflake URL を指定します。例:https://orgname-myaccount.snowflakecomputing.com
CData JDBC Driver for Snowflake からコピーした JDBC URL を Edit new database に入力します。
- Drivers の下にある「(+) Add」ボタンをクリックします。Drivers ボードに「newLine」が表示されます。新しい行の末尾にある (...) をクリックし、Install a new module ラジオボタンを選択して、(...) をクリックしてインストールディレクトリの「lib」サブフォルダにある JAR ファイルへのパスを追加します。OK をクリックします。
- Driver Class として cdata.jdbc.snowflake(前のステップで指定したインストールディレクトリから取得した JAR ファイル)を選択します。
新しい接続のテスト
- Check Connection をクリックします。入力した詳細が正しければ、「Connection successful」という確認プロンプトが表示されます。「OK」と「Finish」をクリックします。
- 接続が確立されたら、新しく作成した接続を右クリックし、Retrieve Schema を選択します。フィルターを使用して必要なデータを取得することもできます。Next をクリックします。
- Schema ウィンドウで「CData」カタログを展開し、Snowflake スキーマからインポートするテーブルを選択します。Next をクリックします。
- 次のステップで、テーブルから表示するカラムを選択し、Finish をクリックします。
- Snowflake スキーマから選択したすべてのテーブルが、JDBC 接続の Table Schemas セクションに表示されます。
- 選択したテーブルのいずれかを右クリックし、Data Viewer をクリックしてデータソースからのデータをプレビューします。
おわりに
CData JDBC Driver for Snowflake の30日間無償トライアルをダウンロードして、Talend Cloud Data Management Platform で Snowflake データを連携しましょう。ご不明な点があれば、サポートチームにお問い合わせください。