Denodo Platform で CSV のデータ に接続
Denodo Platform は、エンタープライズデータベースのデータを統合的に扱うことができるデータ仮想化製品です。CData JDBC Driver for CSV と組み合わせることで、Denodo ユーザーは他のエンタープライズデータソースと並んでライブ CSV のデータ を扱うことができます。本記事では、Denodo Virtual DataPort Administrator で CSV 用の仮想データソースを作成する方法を解説します。
CData JDBC Driver は、最適化されたデータ処理機能を内蔵しており、ライブ CSV のデータ とのやり取りにおいて比類のないパフォーマンスを提供します。CSV に対して複雑な SQL クエリを発行すると、ドライバーはフィルターや集計などのサポートされている SQL 操作を直接 CSV にプッシュし、内蔵の SQL エンジンを使用してサポートされていない操作(主に SQL 関数や JOIN 操作)をクライアントサイドで処理します。また、動的メタデータクエリ機能を内蔵しているため、ネイティブデータ型を使用して CSV のデータ を操作・分析できます。
CSV 仮想ポートの作成
Denodo からライブ CSV のデータ に接続するには、JDBC Driver の JAR ファイルを Denodo の外部ライブラリディレクトリにコピーし、Virtual DataPort Administrator ツールで新しい JDBC データソースを作成します。
- CData JDBC Driver for CSV インストーラーをダウンロードし、パッケージを解凍して JAR ファイルを実行してドライバーをインストールします。
- インストール先(通常は C:\Program Files\CData\CData JDBC Driver for CSV\lib\)から JAR ファイル(およびライセンスファイルが存在する場合はそれも)を Denodo 外部ライブラリディレクトリ(C:\Denodo\Denodo Platform\lib-external\jdbc-drivers\cdata-csv-19)にコピーします。
- Denodo Virtual DataPort Administrator ツールを開き、Server Explorer タブに移動します。
- "admin" を右クリックし、New -> Data source -> JDBC を選択します。
- JDBC 接続を設定します:
- Name: 任意の名前(例: csv)
- Database adapter: Generic
- Driver class path: C:\Denodo\Denodo Platform\lib-external\jdbc-drivers\cdata-csv-19
- Driver class: cdata.jdbc.csv.CSVDriver
Database URI: 必要な接続プロパティを使用して JDBC URL を設定します。例:
jdbc:csv:DataSource=MyCSVFilesFolder;
Database URI の作成方法は以下のとおりです:
ビルトイン接続文字列デザイナー
JDBC URL の構築には、CSV JDBC Driver に組み込まれた接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行してください。
java -jar cdata.jdbc.csv.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
CSV 接続プロパティの取得・設定方法
DataSource プロパティにローカルフォルダ名を設定します。
.csv、.tab、.txt ではない拡張子のファイルを扱う場合には、IncludeFiles 使用する拡張子をカンマ区切りで設定します。Microsoft Jet OLE DB 4.0 driver 準拠の場合にはExtended Properties を設定することができます。別の方法として、Schema.ini ファイルにファイル形式を記述することも可能です。
CSV ファイルの削除や更新を行う場合には、UseRowNumbers をTRUE に設定します。RowNumber はテーブルKey として扱われます。
Amazon S3 内のCSV への接続
URI をバケットおよびフォルダに設定します。さらに、次のプロパティを設定して認証します。
- AWSAccessKey:AWS アクセスキー(username)に設定。
- AWSSecretKey:AWS シークレットキーに設定。
Box 内のCSV への接続
URI をCSV ファイルを含むフォルダへのパスに設定します。Box へ認証するには、OAuth 認証標準を使います。 認証方法については、Box への接続 を参照してください。
Dropbox 内のCSV への接続
URI をCSV ファイルを含むフォルダへのパスに設定します。Dropbox へ認証するには、OAuth 認証標準を使います。 認証方法については、Dropbox への接続 を参照してください。ユーザーアカウントまたはサービスアカウントで認証できます。ユーザーアカウントフローでは、以下の接続文字列で示すように、ユーザー資格情報の接続プロパティを設定する必要はありません。
SharePoint Online SOAP 内のCSV への接続
URI をCSV ファイルを含むドキュメントライブラリに設定します。認証するには、User、Password、およびStorageBaseURL を設定します。
SharePoint Online REST 内のCSV への接続
URI をCSV ファイルを含むドキュメントライブラリに設定します。StorageBaseURL は任意です。指定しない場合、ドライバーはルートドライブで動作します。 認証するには、OAuth 認証標準を使用します。
FTP 内のCSV への接続
URI をルートフォルダとして使用されるフォルダへのパスが付いたサーバーのアドレスに設定します。認証するには、User およびPassword を設定します。
Google Drive 内のCSV への接続
デスクトップアプリケーションからのGoogle への認証には、InitiateOAuth をGETANDREFRESH に設定して、接続してください。詳細はドキュメントの「Google Drive への接続」を参照してください。
- "Test connection" ボタンをクリックして設定を確認し、Save をクリックします。
VirtualPort Administrator ツールで CSV のデータ を表示
データソースを作成したら、Denodo Platform で使用する CSV のデータ のベースビューを作成できます。
- 新しく作成した VirtualPort (admin.CSV) で "Create base view" ボタンをクリックします。
- オブジェクトツリーを展開し、インポートするオブジェクト(テーブル)を選択します。
- "Create selected" ボタンをクリックして、CSV のデータ のビューを作成します。
オプション: "Create associations from foreign keys" をクリックして、オブジェクト間のリレーションシップを定義できます。 - ビューが作成されたら、Server Explorer で対象テーブル(cdata_csv_customer)に移動し、選択したテーブルをダブルクリックします。
- 新しいタブで "Execution panel" をクリックしてクエリパネルを開きます。
- "Execute" タブでクエリをカスタマイズするか、デフォルトのクエリを使用します:
SELECT * FROM cdata_csv_customer CONTEXT ('i18n'='us_est', 'cache_wait_for_load'='true')
- Execute をクリックしてデータを表示します。
ベースビューの作成後は、Denodo Platform の他のデータソースと同様にライブ CSV のデータ を扱うことができます。たとえば、Denodo Data Catalog で CSV をクエリできます。
CData JDBC Driver for CSV の 30日間無料トライアルをダウンロードして、Denodo Platform でライブ CSV のデータ の活用を始めましょう。ご不明な点がございましたら、サポートチーム までお問い合わせください。