Hive のデータから SSAS テーブルモデルを作成

Dibyendu Datta
Dibyendu Datta
Lead Technology Evangelist
CData ドライバーを使用してHive のデータから SQL Server Analysis Services のテーブルモデルを構築する方法を解説します。

SQL Server Analysis Services(SSAS)は、意思決定支援やビジネス分析に使用される分析データエンジンです。Power BI、Excel、Reporting Services レポート、その他のデータビジュアライゼーションツールなど、ビジネスレポートやクライアントアプリケーション向けのエンタープライズグレードのセマンティックデータモデルを提供します。CData ODBC Driver for Apache Hive と組み合わせることで、Hive のデータ からテーブルモデルを作成し、より深く高速なデータ分析を実現できます。

Hive のデータへの接続を作成

まだ行っていない場合は、ODBC DSN(データソース名)で接続プロパティを設定します。これはドライバーインストールの最後のステップです。Microsoft ODBC データソースアドミニストレーターを使用して ODBC DSN を作成・設定できます。

Apache Hive への接続を確立するには以下を指定します。

  • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:HiveServer2 インスタンスへの接続用のポートに設定。
  • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
  • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

Hive のデータソースを作成

まず、Visual Studio で新しい Analysis Services テーブルプロジェクトを作成します。テーブルモデルデザイナーダイアログで、互換性レベル 1400 以上を選択してください。次に、プロジェクトに Hive のデータソースを作成します。

  1. テーブルモデルエクスプローラーで Data Sources を右クリックし、「New Data Source」を選択します
  2. Other タブから「ODBC」を選択し、「Connect」をクリックします
  3. 先ほど設定した DSN を選択します
  4. 認証オプションとして「Default or Custom」を選択し、「Connect」をクリックします

テーブルとリレーションシップの追加

データソースを作成したら、テーブルをインポートしてテーブル間のリレーションシップを定義します。

  1. 新しいデータソースを右クリックし、「Import New Tables」をクリックしてインポートするテーブルを選択します
  2. テーブルのインポート後、「Relationships」を右クリックし、「Create Relationships」をクリックします
  3. テーブルを選択し、外部キー、カーディナリティ、フィルタの方向を設定します

メジャーの作成

テーブルのインポートとリレーションシップの定義が完了したら、メジャーを作成します。

  1. メジャーを作成するテーブルのカラムを選択します
  2. Extensions メニューから「Columns」->「AutoSum」をクリックし、集計方法を選択します

モデルのデプロイ

メジャーを作成したら、モデルをデプロイする準備が整いました。ソリューションエクスプローラーでプロジェクトを右クリックし、「Properties」を選択してターゲットサーバーとデータベースを設定します。「Deployment Server」プロパティを設定し、「OK」をクリックします。

デプロイサーバーの設定後、「Build」メニューを開き、「Deploy Solution」をクリックします。これで SSAS インスタンスにHive のデータのテーブルモデルが作成され、分析、レポート作成、表示の準備が整いました。CData ODBC Driver for Apache Hive の 30 日間無料トライアルをぜひお試しください。

はじめる準備はできましたか?

Apache Hive ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Hive Icon Apache Hive ODBC Driver お問い合わせ

Hive ODBC Driver は、ODBC 接続をサポートする任意のアプリケーションからApache Hive データに直接接続できるパワフルなツールです。

ドライバーはSQL をHiveQL にマッピングして、標準SQL-92 で直接Apache Hive にアクセスできます。