Clear Analytics でHDFS のデータを使ってチャートを作成

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Clear Analytics でHDFS のデータ を基にした動的なチャートを作成し、分析を実行。

CData ODBC ドライバー for HDFS は、ODBC 標準を介してHDFS のライブデータへのアクセスを可能にし、さまざまな BI、レポート、ETL ツールでHDFS のデータ を直接扱うことができます。この記事では、Microsoft Excel のアドインである Clear Analytics を使って、HDFS に ODBC データソースとして接続し、HDFS のデータ を基にしたクエリ、テーブル、チャート(PivotTable を含む)を作成する方法を説明します。

HDFS のデータに接続


ODBC データソース名の設定

まだ設定していない場合は、データソース名(DSN)で必要な接続プロパティを指定します。Microsoft ODBC データソースアドミニストレーターを使って DSN を作成・設定できます。これはドライバーインストールの最終ステップでも可能です。Microsoft ODBC データソースアドミニストレーターを使った DSN の作成と設定方法については、ヘルプドキュメントの「はじめに」を参照してください。

HDFS 接続プロパティの取得・設定方法

HDFS への認証には、次の接続プロパティを設定します。

  • Host:HDFS インスタンスのホストに設定。
  • Port:HDFS インスタンスのポートに設定。デフォルトのポートは"9870" です。

DSN を設定する際、Max Rows 接続プロパティを設定することもできます。これにより返される行数が制限され、レポートやビジュアライゼーションを作成する際のパフォーマンス向上に役立ちます。

Clear Analytics でデータソースを設定

  1. Excel を開き、CLEAR ANALYTICS リボンに移動します。Data Manager を開きます。
  2. データソースとして Database を選択します。
  3. Set Connection セクションで、新しいデータベースを作成するオプションをクリックします。
  4. データソースとして Microsoft ODBC Data Source を選択し、OK をクリックします。
  5. ドロップダウンメニューから、先ほど設定した DSN を選択します。
  6. Set Connection セクションに戻り、SQL Builder Provider として Standard (ANSI ODBC) Query Builder を選択して Next をクリックします。
  7. Schema/Owner を選択し、Clear Analytics で使用するドメイン(テーブル)を選択します。
  8. 必要に応じて、テーブルやカラムの表示名と説明をカスタマイズしてデータオブジェクトを準備します。
  9. CData ODBC ドライバーの大半では、ドメインにキー日付を設定する必要はありません。
  10. Domain Relations セクションで、テーブル間のリレーション情報を追加します。
  11. Domain Tree セクションで、データのグループを作成し、利用可能な項目をグループに追加します。
  12. データのサマリーを確認し、Finish をクリックします。

HDFS のデータでチャートを作成

これでHDFS のデータ を使ったチャートを作成する準備ができました。

新規クエリの作成

  1. CLEAR ANALYTICS リボンの Repository をクリックします。
  2. 新しいクエリを作成します。
  3. 取得するカラムを選択します。
  4. データの集計タイプを設定します(データを集計しない場合は空白のエントリを使用します)。
  5. カラムを下のウィンドウにドラッグして、フィルタと数式を設定します。
  6. クエリに名前を付けて Save をクリックします。

クエリレポートに基づいてチャートを作成

クエリを作成したら、レポートを実行してチャートを表示する準備ができました。
  1. CLEAR ANALYTICS リボンの Report Explorer をクリックします。
  2. Report Explorer ペインで、ツールバーの「New Report」アイコンをクリックします。
  3. 先ほど作成したクエリを選択します。
  4. レポートに名前を付けて「Save and Execute」をクリックします。
  5. Report Explorer 内の Results タブをクリックします。
  6. レポートを展開し、チャートを Excel スプレッドシートにドラッグします。
  7. 表示される PivotChart ウィンドウで、フィールド(カラム)を Filters、Legends、Axis (Categories)、Values ウィンドウにドラッグします。

Clear Analytics で新しいデータソースを確立し、チャートを作成したら、HDFS のデータ の分析を始める準備ができました。ODBC Driver for HDFS と Clear Analytics を使用すると、HDFS からのライブデータを使って Excel でセルフサービス分析を実行できます。

はじめる準備はできましたか?

HDFS ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

HDFS Icon HDFS ODBC Driver お問い合わせ

HDFS ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからHDFS にデータ連携。

HDFS データにデータベースと同感覚でアクセスして、HDFS データに使い慣れたODBC インターフェースで連携。