Hive のデータをPower BI Service にインポートしてビジュアライズ

加藤龍彦
加藤龍彦
デジタルマーケティング
CData Connect AI を使用してHive のOData フィードを作成し、Power BI Service でカスタムレポートを作成します。

Power BI を使えば、企業のデータを豊富なビジュアルに変換して収集および整理することができるため、重要なことだけに集中できます。CData Connect AI と組み合わせると、ビジュアライゼーションやダッシュボード用にHive のデータにアクセスできます。この記事では、CData Connect AI を使用してHive のOData フィードを生成し、Hive のデータをPower BI にインポートして、Power BI サービスのHive のデータに関するレポートを作成する方法について説明します。

Connect AI を構成する

Power BI online でHive のデータを操作するには、Connect AI からHive に接続し、コネクションにユーザーアクセスを提供してHive のデータのOData エンドポイントを作成する必要があります。

Hive に接続したら、目的のテーブルのOData エンドポイントを作成します。

(オプション)新しいConnect AI ユーザーの追加

必要であれば、Connect AI 経由でHive に接続するユーザーを作成します。

  1. ユーザーページに移動し、 Invite Users をクリックします。
  2. 新しいユーザーのE メールアドレスを入力して、 Send to invite the user をクリックします。 新しいユーザーを招待
  3. ユーザーページからユーザーを確認および編集できます。 Connect AI users

パーソナルアクセストークンの追加

OAuth 認証をサポートしていないサービス、アプリケーション、プラットフォーム、またはフレームワークから接続する場合は、認証に使用するパーソナルアクセストークン(PAT)を作成できます。きめ細かなアクセス管理を行うために、サービスごとに個別のPAT を作成するのがベストプラクティスです。

  1. Connect AI アプリの右上にあるユーザー名をクリックし、User Profile をクリックします。
  2. User Profile ページでPersonal Access Token セクションにスクロールし、 Create PAT をクリックします。
  3. PAT の名前を入力して Create をクリックします。 Creating a new PAT
  4. パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。

Connect AI からHive に接続

CData Connect AI では、簡単なクリック操作ベースのインターフェースでデータソースに接続できます。

  1. Connect AI にログインし、 Add Connection をクリックします。 コネクションを追加
  2. Add Connection パネルから「Hive」を選択します。 Selecting a data source
  3. 必要な認証プロパティを入力し、Hive に接続します。

    Apache Hive への接続を確立するには以下を指定します。

    • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:HiveServer2 インスタンスへの接続用のポートに設定。
    • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
    • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します
    Configuring a connection (Salesforce is shown)
  4. Create & Test をクリックします。
  5. Edit Hive Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。 権限を更新

Connect AI にHive OData エンドポイントを追加する

Hive に接続したら、目的のテーブルのOData エンドポイントを作成します。

  1. OData ページに移動し、 Add to create new OData endpoints をクリックします。
  2. Hive コネクション(例:ApacheHive1)を選択し、Next をクリックします。
  3. 使用するテーブルを選択し、Confirm をクリックします。 テーブルを選択(Salesforce の例)

接続とOData エンドポイントが構成されたら、Power BI online からHive のデータに接続できるようになります。

Power BI Desktop からデータセットを公開する

Connect AI にOData エンドポイントを追加すると、OData 接続を使用してPower BI Desktop にデータセットを作成し、そのデータセットをPower BI サービスに公開できます。

  1. Power BI を開いて「データを取得」-->「詳細」とクリックし、OData フィードを選択して「接続」をクリックします。
  2. Create a new connection in Power BI
  3. URL をConnect AI インスタンスのBase URL(例: https://cloud.cdata.com/api/odata/service)に設定し、「OK」をクリックします。
  4. ユーザー名パスワード を上記のユーザー名とPAT に設定します。
  5. 設定を適用するレベルとして、フルのBase URL(https://cloud.cdata.com/api/odata/service)を選択します。 Connect to Cdata Connect AI instance
  6. 「ナビゲーター」ダイアログでテーブルを選択し、ビジュアライズします。
  7. 「読み込み」をクリックしてPower BI にデータをプルします。
  8. 「リレーションシップ」タブで選択したエンティティ間の関連を定義します。
  9. 「ホーム」メニューから「発行」をクリックして「ワークスペース」を選択します。

Power BI Service のHive のデータでレポートとダッシュボードを作成します。

Power BI サービスにデータセットを公開したので、公開されたデータに基づいて新しいレポートとダッシュボードを作成できます。

  1. PowerBI.com にログインします。
  2. 「ワークスペース」をクリックし、ワークスペースを選択します。
  3. 「作成」をクリックし、「レポート」を選択します。
  4. レポート用に公開されたデータセットを選択します。 Select a dataset
  5. フィールドとビジュアライゼーションを選択してレポートを追加します。 Power BI サービスでHive のデータをビジュアライズ

クラウドアプリケーションからHive のデータへのSQL アクセス

Power BI サービスからリアルタイムHive のデータへの直接接続ができるようになりました。これで、Hive を複製せずにより多くのデータソースや新しいビジュアライゼーション、レポートを作成することができます。

クラウドアプリケーションから直接100を超えるSaaS 、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスを取得するには、CData Connect AI をお試しください。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ