Power Map で Databricks のデータ の地理的関係を探索

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Power Map でDatabricks のデータを使用してデータビジュアライゼーションを作成。

CData ODBC Driver for Databricks は、Power BI などのセルフサービス分析ソリューションと簡単にセットアップして使用できます。Microsoft Excel は ODBC 標準を組み込みでサポートしています。この記事では、現在のDatabricks のデータを Excel に読み込み、Power Map でDatabricks のデータの位置情報に基づく分析を開始する方法を説明します。

Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


Databricks 用の ODBC データソースを作成

まだ設定していない場合は、ODBC DSN(データソース名)で接続プロパティを指定します。これはドライバーインストールの最後のステップです。Microsoft ODBC データソースアドミニストレーターを使用して、ODBC DSN を作成・設定できます。

Databricks 接続プロパティの取得・設定方法

Databricks クラスターに接続するには、以下のプロパティを設定します。

  • Database:Databricks データベース名。
  • Server:Databricks クラスターのサーバーのホスト名
  • HTTPPath:Databricks クラスターのHTTP パス。
  • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

Databricks への認証

CData は、次の認証スキームをサポートしています。

  • 個人用アクセストークン
  • Microsoft Entra ID(Azure AD)
  • Azure サービスプリンシパル
  • OAuthU2M
  • OAuthM2M

個人用アクセストークン

認証するには、次を設定します。

  • AuthSchemePersonalAccessToken
  • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

DSN を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数が制限され、レポートやビジュアライゼーションの設計時のパフォーマンス向上に役立ちます。

DSN を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数が制限され、レポートやビジュアライゼーションの設計時のパフォーマンス向上に役立ちます。

Databricks のデータ を Excel にインポート

データを Power Map にインポートするには、Excel スプレッドシートまたは Power Pivot を使用します。いずれかの方法でDatabricks のデータをインポートする手順については、ヘルプドキュメントの「ODBC ドライバの使用」セクションを参照してください。

Databricks のデータ をジオコーディング

Databricks のデータ を Excel スプレッドシートまたは PowerPivot にインポートしたら、Power Map で Databricks エンティティをドラッグ&ドロップできます。Power Map を開くには、スプレッドシート内の任意のセルをクリックし、[挿入] -> [マップ] をクリックします。

[地理の選択] メニューで、Power Map が地理情報を持つカラムを検出します。[レイヤーペイン] の [地理とマップレベル] メニューで、使用するカラムを選択できます。Power Map がデータをプロットします。ドットは、この値を持つレコードを表します。使用する地理カラムを選択したら、[次へ] をクリックします。

メジャーとカテゴリを選択

次に、カラムを選択するだけで済みます。メジャーとカテゴリは自動的に検出されます。利用可能なチャートタイプは、積み上げ縦棒、クラスター縦棒、バブル、ヒートマップ、リージョンです。

はじめる準備はできましたか?

Databricks ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Databricks Icon Databricks ODBC Driver お問い合わせ

Databricks ODBC Driver は、ODBC 接続をサポートする各種ツールからDatabricks へのシームレスな連携を実現します。

Databricks に使い慣れたデータベースのように標準ODBC インターフェースで読み書き。