SSAS でAzure Data Lake Storage のデータに連携するOLAP Cube を作成

加藤龍彦
加藤龍彦
デジタルマーケティング
Azure Data Lake Storage のデータプロバイダーを利用してAnalysis Services プロジェクト内のAzure Data Lake Storage に接続し、アナリティクスやレポーティングなどで使えるOLAP キューブを構築します。

SQL Server Analysis Services (SSAS) は、意思決定支援やビジネスアナリティクスで使われる解析エンジンです。ビジネスレポートおよび、Power BI やExcel、 Reporting Services レポート、その他のデータ可視化ツールのようなクライアントアプリケーションに、エンタープライズレベルのセマンティックデータを提供します。Azure Data Lake Storage 用のCData ADO.NET プロバイダーと合わせれば、Azure Data Lake Storage を使って、より深く速いデータ分析のためのキューブを作成できます。

この記事では、Analysis Services プロジェクトをVisual Studio で作成し、Azure Data Lake Storage の多次元モデルを構築および配置する方法を説明します。これには、アクセス可能なSSAS インスタンスと、ADO.NET プロバイダーのインストールが必要です。

Azure Data Lake Storage 用のJDBC データソースの設定

まず、Visual Studio で新しい多元的なAnalysis Service とデータマイニングプロジェクトを作成します。次に、プロジェクト内でAzure Data Lake Storage 用のデータソースを作成します。

  1. [Solution Explorer] の[Data Source] を右クリックし、[New Data Source] を選択します。
  2. 既存または新規の接続に基づいて、データソースを作成することを選択し、[New] をクリックします。
  3. [Connection Manager] のAzure Data Lake Storage 用CData ADO.NET プロバイダーを選択し、必要な接続プロパティに入力後、[Next] をクリックします。

    Azure Data Lake Storage 接続プロパティの取得・設定方法

    Azure Data Lake Storage Gen2 への接続

    それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。

    • Account:ストレージアカウントの名前
    • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
    • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます

    Azure Data Lake Storage Gen2への認証

    続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。

    アクセスキー

    アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

    Azure ポータルでの手順は以下のとおりです:

    1. ADLS Gen2ストレージアカウントにアクセスします
    2. 設定でアクセスキーを選択します
    3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします

    接続の準備ができたら、以下のプロパティを設定してください。

    • AuthSchemeAccessKey
    • AccessKey:先ほどAzure ポータルで取得したアクセスキーの値

    共有アクセス署名(SAS)

    共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。

    接続の準備ができたら、以下のプロパティを設定してください。

    • AuthSchemeSAS
    • SharedAccessSignature:先ほど生成した共有アクセス署名の値

    その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。

    接続を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。

    Setting the Connection properties (Salesforce is shown.)
  4. インパーソネーションを[Inherit] に設定し、[Next] をクリックします。 Setting the impersonation method.
  5. データソースに名称(CData Azure Data Lake Storage Source) を入力し、[Finish] をクリックします。

データソースビューの作成

データソースの次に、データソースビューを作成します。

  1. [Solution Explorer] で[Data Source Views] を右クリックし、[New Data Source View] を選択します。
  2. 先ほど作成したデータソース(CData Azure Data Lake Storage Source) を選択し、[Next] をクリックします。
  3. 基になるデータソースのパターンに一致する外部キーを選択し、[Next] をクリックします。 Selecting the Foreign key match pattern.
  4. Azure Data Lake Storage の表を選択、ビューに追加し、[Next] をクリックします。 Selecting Tables (Salesforce is shown).
  5. ビューに名前を付け、[Finish] をクリックします。

スキームに一致する外部キーに基づいて、基礎的なデータとのリレーションが検出されます。[Data Source View] をダブルクリックすることで、これらのリレーションを確認・編集することができます。

Discovered relationships in the data source view (Salesforce is shown).

[Data Source View] へのセカンダリデータソースの追加はサポートされないことに注意してください。複数のデータソースを利用する場合、SSAS は、すべてのソースがADO.NET プロバイダーでは使用できないOpenRowset 経由のリモートクエリをサポートすることを必要とします。

Azure Data Lake Storage 用のキューブを作成する

プロジェクトを処理してAzure Data Lake Storage をSSAS に展開するための最後のステップはキューブの作成です。

  1. [Solution Explorer] の[Cubes] を右クリックし、[New Cube] を選択します。
  2. [Use existing tables] を選択し、[Next] をクリックします。
  3. メジャーグループテーブルに使用するテ-ブルを選択し、[Next] をクリックします。 Selecting measure group tables (Salesforce is shown).
  4. キューブに含ませたいメジャーを選択し、[Next] をクリックします。 Selecting measures (Salesforce is shown).
  5. 使用可能なテーブルに基づいて作成するディメンションを選択し、[Next] をクリックします。 Selecting dimensions (Salesforce is shown).
  6. すべての選択内容を確認し、[Finish] をクリックします。

プロジェクトを処理する

データソースと、データソースビュー、キューブを作成すると、SSASにキューブを展開する準備が完了します。ターゲットサーバーとデータベースを構成するために、プロジェクトを右クリックしプロパティを選択します。デプロイメントに移動し、ターゲットセクションでサーバーとデータベースのプロパティを設定します。

Configuring the target server and database.

ターゲットサーバーとデータベースを構成した後、プロジェクトを右クリックして[Process] を選択します。このステップの一部として、プロジェクトの構成・デプロイが必要となる場合があります。プロジェクトを構成・デプロイし、[Process Database]ウィザードにある[Run] をクリックします。

SSAS インスタンスにAzure Data Lake Storage 用のOLAP キューブが作成され、分析、レポート、表示の準備が完了します。Azure Data Lake Storage 用のCData ADO.NET プロバイダーの30日の無償評価版をダウンロードして、SSAS データをご利用ください。

はじめる準備はできましたか?

Azure Data Lake Storage Data Provider の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Azure Data Lake Storage Icon Azure Data Lake Storage ADO.NET Provider お問い合わせ

Azure Data Lake Storage データに連携する.NET アプリケーションを素早く、簡単に開発できる便利なドライバー。