Clear Analytics でHive のデータを使ってチャートを作成

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Clear Analytics でHive のデータ を基にした動的なチャートを作成し、分析を実行。

CData ODBC ドライバー for Hive は、ODBC 標準を介してHive のライブデータへのアクセスを可能にし、さまざまな BI、レポート、ETL ツールでHive のデータ を直接扱うことができます。この記事では、Microsoft Excel のアドインである Clear Analytics を使って、Hive に ODBC データソースとして接続し、Hive のデータ を基にしたクエリ、テーブル、チャート(PivotTable を含む)を作成する方法を説明します。

Hive のデータに接続


ODBC データソース名の設定

まだ設定していない場合は、データソース名(DSN)で必要な接続プロパティを指定します。Microsoft ODBC データソースアドミニストレーターを使って DSN を作成・設定できます。これはドライバーインストールの最終ステップでも可能です。Microsoft ODBC データソースアドミニストレーターを使った DSN の作成と設定方法については、ヘルプドキュメントの「はじめに」を参照してください。

Apache Hive への接続を確立するには以下を指定します。

  • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:HiveServer2 インスタンスへの接続用のポートに設定。
  • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
  • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

DSN を設定する際、Max Rows 接続プロパティを設定することもできます。これにより返される行数が制限され、レポートやビジュアライゼーションを作成する際のパフォーマンス向上に役立ちます。

Clear Analytics でデータソースを設定

  1. Excel を開き、CLEAR ANALYTICS リボンに移動します。Data Manager を開きます。
  2. データソースとして Database を選択します。
  3. Set Connection セクションで、新しいデータベースを作成するオプションをクリックします。
  4. データソースとして Microsoft ODBC Data Source を選択し、OK をクリックします。
  5. ドロップダウンメニューから、先ほど設定した DSN を選択します。
  6. Set Connection セクションに戻り、SQL Builder Provider として Standard (ANSI ODBC) Query Builder を選択して Next をクリックします。
  7. Schema/Owner を選択し、Clear Analytics で使用するドメイン(テーブル)を選択します。
  8. 必要に応じて、テーブルやカラムの表示名と説明をカスタマイズしてデータオブジェクトを準備します。
  9. CData ODBC ドライバーの大半では、ドメインにキー日付を設定する必要はありません。
  10. Domain Relations セクションで、テーブル間のリレーション情報を追加します。
  11. Domain Tree セクションで、データのグループを作成し、利用可能な項目をグループに追加します。
  12. データのサマリーを確認し、Finish をクリックします。

Hive のデータでチャートを作成

これでHive のデータ を使ったチャートを作成する準備ができました。

新規クエリの作成

  1. CLEAR ANALYTICS リボンの Repository をクリックします。
  2. 新しいクエリを作成します。
  3. 取得するカラムを選択します。
  4. データの集計タイプを設定します(データを集計しない場合は空白のエントリを使用します)。
  5. カラムを下のウィンドウにドラッグして、フィルタと数式を設定します。
  6. クエリに名前を付けて Save をクリックします。

クエリレポートに基づいてチャートを作成

クエリを作成したら、レポートを実行してチャートを表示する準備ができました。
  1. CLEAR ANALYTICS リボンの Report Explorer をクリックします。
  2. Report Explorer ペインで、ツールバーの「New Report」アイコンをクリックします。
  3. 先ほど作成したクエリを選択します。
  4. レポートに名前を付けて「Save and Execute」をクリックします。
  5. Report Explorer 内の Results タブをクリックします。
  6. レポートを展開し、チャートを Excel スプレッドシートにドラッグします。
  7. 表示される PivotChart ウィンドウで、フィールド(カラム)を Filters、Legends、Axis (Categories)、Values ウィンドウにドラッグします。

Clear Analytics で新しいデータソースを確立し、チャートを作成したら、Hive のデータ の分析を始める準備ができました。ODBC Driver for Hive と Clear Analytics を使用すると、Hive からのライブデータを使って Excel でセルフサービス分析を実行できます。

はじめる準備はできましたか?

Apache Hive ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Hive Icon Apache Hive ODBC Driver お問い合わせ

Hive ODBC Driver は、ODBC 接続をサポートする任意のアプリケーションからApache Hive データに直接接続できるパワフルなツールです。

ドライバーはSQL をHiveQL にマッピングして、標準SQL-92 で直接Apache Hive にアクセスできます。