DBeaver からDatabricks のデータに連携して可視化する方法とは?

加藤龍彦
加藤龍彦
デジタルマーケティング
クエリブラウザなどのDBeaver のビジュアルツールを使ってDatabricks のデータを管理する方法を解説します。

CData JDBC Driver for Databricks は、IDE からBI ツールまで、サードパーティーツールからDatabricks のデータの読み書きを可能にするJDBC 標準を提供します。本記事では、DBeaver のウィザードを使ってDatabricks のデータに接続し、GUI 上でデータを参照する方法を紹介します。

CData JDBC ドライバとは?

CData JDBC ドライバは、以下の特徴を持ったリアルタイムデータ接続ツールです。

  1. Databricks をはじめとする、CRM、MA、グループウェア、広告、会計ツールなど多様な270種類以上のSaaS / DB に対応
  2. DBeaver を含む多様なアプリケーション、ツールにDatabricks のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData JDBC ドライバでは、1.データソースとしてDatabricks の接続を設定、2.DBeaver 側でJDBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData JDBC ドライバのインストールとDatabricks への接続設定

まずは、本記事右側のサイドバーからDatabricks JDBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

次に、以下の手順でDBeaver にドライバーのJAR ファイルをロードします。

  1. DBeaver アプリケーションを開き、「データベース」メニューの「ドライバーマネジャー」オプションを選択します。「新規」をクリックして「新しいドライバを作成する」フォームを開きます。
  2. 設定タブで:
    • ドライバ名をわかりやすい名前に設定します(例:CData JDBC Driver for Databricks)。
    • クラス名をJDBC ドライバーのクラス名「cdata.jdbc.databricks.DatabricksDriver」に設定します。
    • URL テンプレートjdbc:databricks: に設定します。
    新しいドライバーの設定(Salesforce の場合)。
  3. ライブラリタブで「ファイルを追加」をクリックし、インストールディレクトリ(C:\Program Files\CData\CData JDBC Driver for Databricks XXXX\)の「lib」フォルダに移動してJAR ファイル(cdata.jdbc.Databricks.jar)を選択します。 JDBC JAR ファイルをロード(Salesforce の場合)。

Databricks のデータの接続を作成

以下の手順で、認証情報およびその他の必要な接続プロパティを追加します。

  1. 「データベース」メニューで、「新しい接続」をクリックします。
  2. 表示される「新しい接続を作成する」 ウィザードで、先ほど作成したドライバー(例:CData JDBC Driver for Databricks)を選択し、「次へ >」をクリックします。 ドライバーを選択(Salesforce の場合)。
  3. 設定ウィザードの一般タブで、以下を参考に必要な接続プロパティを使用してJDBC URL を設定します。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • 個人用アクセストークン
    • Microsoft Entra ID(Azure AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    個人用アクセストークン

    認証するには、次を設定します。

    • AuthSchemePersonalAccessToken
    • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

    組み込みの接続文字列デザイナー

    JDBC URL の作成の補助として、Databricks JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。

    java -jar cdata.jdbc.databricks.jar
    

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    組み込みの接続文字列デザイナーを使ってJDBC URL を生成(Salesforce の場合)

    一般的な接続文字列:

    jdbc:databricks:Server=127.0.0.1;HTTPPath=MyHTTPPath;User=MyUser;Token=MyToken;
    
    JDBC URL を設定(Salesforce の場合)。
  4. 「テスト接続」をクリックして、接続が正しく設定されていることを確認します。 正しく設定された接続(Salesforce の場合)。
  5. 「終了」をクリックします。

Databricks のデータにクエリを実行

これで、接続できたことで公開されたテーブルのデータにクエリを実行できるようになりました。テーブルを右クリックし、「ビュー表」をクリックします。「データ」タブでデータを確認できます。

DBeaver でのクエリの結果(Salesforce の場合)。

おわりに

CData JDBC Driver for Databricks の 30日間無償トライアル をダウンロードして、DBeaver でリアルタイムDatabricks のデータの操作をはじめましょう!ご不明な点があれば、サポートチームにお問い合わせください。

はじめる準備はできましたか?

Databricks Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Databricks Icon Databricks JDBC Driver お問い合わせ

Databricks 連携のパワフルなJava アプリケーションを素早く作成して配布。