Dremio でIBM Cloud Object Storage のデータに外部ソースとして接続

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
CData JDBC Driver を使用して、Dremio でIBM Cloud Object Storage に外部ソースとして接続します。

CData JDBC Driver for IBM Cloud Object Storage はJDBC 標準を実装しており、Dremio を含むさまざまなアプリケーションでリアルタイムのIBM Cloud Object Storage のデータを扱えるようにします。Dremio は、データレイク上でのセルフサービス型インタラクティブ分析を実現するために設計されたデータレイクハウスプラットフォームです。CData JDBC ドライバーを使用することで、エンタープライズデータレイクの一部としてリアルタイムIBM Cloud Object Storage のデータを活用できます。この記事では、Dremio でIBM Cloud Object Storage のデータに外部ソースとして接続する方法について説明します。

CData JDBC Driver を使用すると、Dremio でリアルタイムIBM Cloud Object Storage のデータへの高速アクセスが可能になります。ドライバーをインストールしてIBM Cloud Object Storage で認証すれば、データレイク内でIBM Cloud Object Storage のデータにすぐにアクセスできます。ネイティブのデータ型を使用してIBM Cloud Object Storage のデータを表示し、複雑なフィルタ、集計、その他の操作を自動的に処理することで、CData JDBC Driver はIBM Cloud Object Storage のデータへのシームレスなアクセスを提供します。

前提条件

この記事では、Docker を使用して Dremio を実行することを想定しています。以下のようなコマンドで Dremio サービスを含む Docker コンテナを作成できます。

docker run -d --name dremio -p 9047:9047 -p 31010:31010 dremio/dremio-oss

ここで、dremio はコンテナの名前、9047 は Dremio Web インターフェース用のコンテナポート、31010 は Dremio クエリサービスにマッピングされるポートです。dremio/dremio-oss は使用するイメージを指定します。

ARP コネクタのビルド

CData JDBC Driver を Dremio で使用するには、Advanced Relation Pushdown(ARP)コネクタをビルドする必要があります。GitHub でソースコードを確認するか、ZIP ファイル(GitHub.com)を直接ダウンロードできます。ファイルをコピーまたは展開したら、コネクタのルートディレクトリ(pom.xml ファイルがあるディレクトリ)から以下のコマンドを実行してコネクタをビルドします。

mvn clean install

NOTE:CData ARP コネクタは Java 11 でコンパイルするようにビルドされています。Java 11 をインストールし、正しいバージョンを使用していることを確認してください。以下のようなコマンドで Java バージョンを更新できます。

sudo update-alternatives --config java

コネクタ用の JAR ファイルが(target ディレクトリに)ビルドされたら、ARP コネクタと JDBC Driver を Dremio インスタンスにコピーする準備が整いました。

コネクタと JDBC Driver のインストール

ARP コネクタを %DREMIO_HOME%/jars/ に、IBM Cloud Object Storage 用の JDBC Driver を %DREMIO_HOME%/jars/3rdparty にインストールします。以下のようなコマンドを使用できます。

ARP コネクタ

docker cp PATH\TO\dremio-ibmcloudobjectstorage-plugin-{DREMIO_VERSION}.jar dremio_image_name:/opt/dremio/jars/

IBM Cloud Object Storage 用 JDBC Driver

docker cp PATH\TO\cdata.jdbc.ibmcloudobjectstorage.jar dremio_image_name:/opt/dremio/jars/3rdparty/

IBM Cloud Object Storage への接続

これで、Dremio の外部ソースオプションに IBM Cloud Object Storage が表示されるようになりました。ビルドした ARP コネクタは、JDBC URL を使用してIBM Cloud Object Storage のデータに接続します。JDBC Driver には、接続文字列を作成できるビルトインの接続文字列デザイナーがあります(以下を参照)。

ビルトイン接続文字列デザイナー

JDBC URL の構成については、IBM Cloud Object Storage JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。

java -jar cdata.jdbc.ibmcloudobjectstorage.jar

接続プロパティを入力し、接続文字列をクリップボードにコピーします。

Cloud Object Storage 接続プロパティの取得・設定方法

Cloud Object Storage に接続する前に、Cloud Object Storage インスタンスを登録してCloud Object Storage API キーとCRN を取得していきます。

Cloud Object Storage の新規インスタンスの登録

IBM Cloud アカウントにCloud Object Storage がまだない場合は、以下の手順に従ってアカウントにSQL Query のインスタンスをインストールできます。

  1. IBM Cloud アカウントにログインします。
  2. Cloud Object Storage ページに移動して、インスタンス名を指定して「作成」をクリックします。Cloud Object Storage の新規インスタンスにリダイレクトされます。

API キー

API キーは以下の手順で取得できます。

  1. まずは、IBM Cloud アカウントにログインします。
  2. API キーページに移動します。
  3. 中央右隅のIBM Cloud APIキーの作成 をクリックして、新しいAPI キーを作成します。
  4. ポップアップウィンドウが表示されたら、API キーの名前を指定して作成をクリックします。ダッシュボードからはアクセスできなくなるため、API Key を控えておきましょう。

Cloud Object Storage CRN

デフォルトでは、CData 製品はCloud Object Storage CRN を自動で取得します。ただし、複数のアカウントがある場合は、CloudObjectStorageCRN を明示的に指定する必要があります。この値は、次の2つの方法で取得できます。

  • Services ビューをクエリする。これにより、IBM Cloud Object Storage インスタンスとそれぞれのCRN がリストされます。
  • IBM Cloud で直接CRN を見つける。これを行うには、IBM Cloud のダッシュボードに移動します。リソースリストで、ストレージからCloud Object Storage リソースを選択してCRN を取得します。

IBM Cloud Object Storage への接続

これで準備は完了です。以下の接続プロパティを設定してください。

  • InitiateOAuthGETANDREFRESH に設定。InitiateOAuth を使うと、OAuth 認証を繰り返す必要がなく、さらに自動でアクセストークンを設定できます。
  • ApiKey:セットアップ中に控えたAPI キーを指定。
  • CloudObjectStorageCRN(オプション):控えておいたCloud Object Storage のCRN に設定。Cloud Object Storage アカウントが複数ある場合のみ設定する必要があります。

プロパティを設定したら、これで接続設定は完了です。

NOTE:Dremio で JDBC Driver を使用するには、ライセンス(正式版または評価版)とランタイムキー(RTK)が必要です。このライセンス(または評価版)の取得については、営業チームにお問い合わせください

ランタイムキー(RTK)を JDBC URL に追加します。最終的に、以下のような JDBC URL になります。

jdbc:ibmcloudobjectstorage:RTK=5246...;ApiKey=myApiKey;CloudObjectStorageCRN=MyInstanceCRN;Region=myRegion;OAuthClientId=MyOAuthClientId;OAuthClientSecret=myOAuthClientSecret;

IBM Cloud Object Storage に外部ソースとしてアクセス

IBM Cloud Object Storage を外部ソースとして追加するには、新しいソースを追加するためにクリックし、IBMCloudObjectStorage を選択します。JDBC URL をコピーして、New IBMCloudObjectStorage Source ウィザードに貼り付けます。

接続を保存すれば、Dremio でリアルタイムIBM Cloud Object Storage のデータをクエリする準備が整い、IBM Cloud Object Storage のデータをデータレイクに簡単に取り込むことができます。

詳細情報と無償トライアル

Dremio で CData JDBC Driver for IBM Cloud Object Storage を使用すると、リアルタイムIBM Cloud Object Storage のデータをデータレイクに取り込むことができます。IBM Cloud Object Storage への接続の詳細については、CData JDBC Driver for IBM Cloud Object Storage ページをご覧ください。CData JDBC Driver for IBM Cloud Object Storage の30日間無償トライアルをダウンロードして、今すぐ始めましょう。

はじめる準備はできましたか?

IBM Cloud Object Storage Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

IBM Cloud Object Storage Icon IBM Cloud Object Storage JDBC Driver お問い合わせ

IBM Cloud Object Storage データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。