Dremio でAzure Table のデータに外部ソースとして接続

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
CData JDBC Driver を使用して、Dremio でAzure Table に外部ソースとして接続します。

CData JDBC Driver for Azure はJDBC 標準を実装しており、Dremio を含むさまざまなアプリケーションでリアルタイムのAzure Table のデータを扱えるようにします。Dremio は、データレイク上でのセルフサービス型インタラクティブ分析を実現するために設計されたデータレイクハウスプラットフォームです。CData JDBC ドライバーを使用することで、エンタープライズデータレイクの一部としてリアルタイムAzure Table のデータを活用できます。この記事では、Dremio でAzure Table のデータに外部ソースとして接続する方法について説明します。

CData JDBC Driver を使用すると、Dremio でリアルタイムAzure Table のデータへの高速アクセスが可能になります。ドライバーをインストールしてAzure Table で認証すれば、データレイク内でAzure Table のデータにすぐにアクセスできます。ネイティブのデータ型を使用してAzure Table のデータを表示し、複雑なフィルタ、集計、その他の操作を自動的に処理することで、CData JDBC Driver はAzure Table のデータへのシームレスなアクセスを提供します。

前提条件

この記事では、Docker を使用して Dremio を実行することを想定しています。以下のようなコマンドで Dremio サービスを含む Docker コンテナを作成できます。

docker run -d --name dremio -p 9047:9047 -p 31010:31010 dremio/dremio-oss

ここで、dremio はコンテナの名前、9047 は Dremio Web インターフェース用のコンテナポート、31010 は Dremio クエリサービスにマッピングされるポートです。dremio/dremio-oss は使用するイメージを指定します。

ARP コネクタのビルド

CData JDBC Driver を Dremio で使用するには、Advanced Relation Pushdown(ARP)コネクタをビルドする必要があります。GitHub でソースコードを確認するか、ZIP ファイル(GitHub.com)を直接ダウンロードできます。ファイルをコピーまたは展開したら、コネクタのルートディレクトリ(pom.xml ファイルがあるディレクトリ)から以下のコマンドを実行してコネクタをビルドします。

mvn clean install

NOTE:CData ARP コネクタは Java 11 でコンパイルするようにビルドされています。Java 11 をインストールし、正しいバージョンを使用していることを確認してください。以下のようなコマンドで Java バージョンを更新できます。

sudo update-alternatives --config java

コネクタ用の JAR ファイルが(target ディレクトリに)ビルドされたら、ARP コネクタと JDBC Driver を Dremio インスタンスにコピーする準備が整いました。

コネクタと JDBC Driver のインストール

ARP コネクタを %DREMIO_HOME%/jars/ に、Azure Table 用の JDBC Driver を %DREMIO_HOME%/jars/3rdparty にインストールします。以下のようなコマンドを使用できます。

ARP コネクタ

docker cp PATH\TO\dremio-azuretables-plugin-{DREMIO_VERSION}.jar dremio_image_name:/opt/dremio/jars/

Azure Table 用 JDBC Driver

docker cp PATH\TO\cdata.jdbc.azuretables.jar dremio_image_name:/opt/dremio/jars/3rdparty/

Azure Table への接続

これで、Dremio の外部ソースオプションに Azure Table が表示されるようになりました。ビルドした ARP コネクタは、JDBC URL を使用してAzure Table のデータに接続します。JDBC Driver には、接続文字列を作成できるビルトインの接続文字列デザイナーがあります(以下を参照)。

ビルトイン接続文字列デザイナー

JDBC URL の構成については、Azure Table JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。

java -jar cdata.jdbc.azuretables.jar

接続プロパティを入力し、接続文字列をクリップボードにコピーします。

Account プロパティをストレージアカウント名に設定し、ストレージアカウントのAccessKey を設定して接続します。これらの値を取得する方法は次のとおりです。

ストレージをBackend として使用している場合(デフォルト)

  • Azure ポータルにログインし、左側の「サービス」メニューで「ストレージアカウント」を選択します。
  • ストレージアカウントがない場合は、「追加」ボタンをクリックしてアカウントを作成します。
  • 使用するストレージアカウントのリンクをクリックし、「設定」の「アクセスキー」を選択します。 「アクセスキー」ウィンドウには、ストレージアカウント名とCData 製品で使用するキー(接続にはkey1またはkey2のどちらかを使用できます)が含まれています。これらのプロパティは、それぞれAccount とAccessKey 接続プロパティにマッピングされます。

Azure SQL への接続

  • Azure ポータルにログインし、左側の「サービス」メニューで「Azure Cosmos DB」を選択します。
  • 使用するCosmos DB アカウントのリンクをクリックし、「設定」の「接続文字列」を選択します。 「接続文字列」ウィンドウには、Cosmos DB アカウント名とCData 製品で使用する主キーが含まれています。これらのプロパティは、それぞれAccount とAccessKey 接続プロパティにマッピングされます。

NOTE:Dremio で JDBC Driver を使用するには、ライセンス(正式版または評価版)とランタイムキー(RTK)が必要です。このライセンス(または評価版)の取得については、営業チームにお問い合わせください

ランタイムキー(RTK)を JDBC URL に追加します。最終的に、以下のような JDBC URL になります。

jdbc:azuretables:RTK=5246...;AccessKey=myAccessKey;Account=myAccountName;

Azure Table に外部ソースとしてアクセス

Azure Table を外部ソースとして追加するには、新しいソースを追加するためにクリックし、AzureTables を選択します。JDBC URL をコピーして、New AzureTables Source ウィザードに貼り付けます。

接続を保存すれば、Dremio でリアルタイムAzure Table のデータをクエリする準備が整い、Azure Table のデータをデータレイクに簡単に取り込むことができます。

詳細情報と無償トライアル

Dremio で CData JDBC Driver for Azure を使用すると、リアルタイムAzure Table のデータをデータレイクに取り込むことができます。Azure Table への接続の詳細については、CData JDBC Driver for Azure ページをご覧ください。CData JDBC Driver for Azure の30日間無償トライアルをダウンロードして、今すぐ始めましょう。

はじめる準備はできましたか?

Azure Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Azure Storage Icon Azure JDBC Driver お問い合わせ

リアルタイムなAzure テーブルストレージデータを組み込んだパワフルなJava アプリケーションを短時間・低コストで作成して配布できます。