SSAS でRedshift のデータに連携するOLAP Cube を作成
SQL Server Analysis Services (SSAS) は、意思決定支援やビジネスアナリティクスで使われる解析エンジンです。ビジネスレポートおよび、Power BI やExcel、 Reporting Services レポート、その他のデータ可視化ツールのようなクライアントアプリケーションに、エンタープライズレベルのセマンティックデータを提供します。Redshift 用のCData ADO.NET プロバイダーと合わせれば、Redshift を使って、より深く速いデータ分析のためのキューブを作成できます。
この記事では、Analysis Services プロジェクトをVisual Studio で作成し、Redshift の多次元モデルを構築および配置する方法を説明します。これには、アクセス可能なSSAS インスタンスと、ADO.NET プロバイダーのインストールが必要です。
Redshift 用のJDBC データソースの設定
まず、Visual Studio で新しい多元的なAnalysis Service とデータマイニングプロジェクトを作成します。次に、プロジェクト内でRedshift 用のデータソースを作成します。
- [Solution Explorer] の[Data Source] を右クリックし、[New Data Source] を選択します。
- 既存または新規の接続に基づいて、データソースを作成することを選択し、[New] をクリックします。
- [Connection Manager] のRedshift 用CData ADO.NET プロバイダーを選択し、必要な接続プロパティに入力後、[Next] をクリックします。
Amazon Redshift への接続
それでは、早速Amazon Redshift に接続していきましょう。データに接続するには、以下の接続パラメータを指定します。
- Server:Amazon Redshift データベースをホスティングしているサーバーのホスト名またはIP アドレス
- Database:Amazon Redshift クラスター用に作成したデータベース
- Port(オプション):Amazon Redshift データベースをホスティングしているサーバーのポート。デフォルトは5439です
これらの値は、以下のステップでAWS マネージメントコンソールから取得できます。
- Amazon Redshift コンソールを開きます(http://console.aws.amazon.com/redshift)
- Clusters ページで、クラスター名をクリックしてください
- Configuration タブの"Cluster Database Properties" セクションからプロパティを取得します。接続プロパティの値は、ODBC URL で設定された値と同じになります
Amazon Redshiftへの認証
CData 製品では幅広い認証オプションに対応しています。標準認証情報からIAM クレデンシャル、ADFS、Ping Federate、Microsoft Entra ID(Azure AD)、Azure AD PKCE まで利用可能です。標準認証
ログイン資格情報を使用してAmazon Redshift に接続するには、以下のプロパティを設定してみましょう。- AuthScheme:Basic
- User:認証するユーザーのログイン情報
- Password:認証するユーザーのパスワード
その他の認証方法については、ヘルプドキュメントをご確認ください。
接続を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。
- インパーソネーションを[Inherit] に設定し、[Next] をクリックします。
- データソースに名称(CData Redshift Source) を入力し、[Finish] をクリックします。
データソースビューの作成
データソースの次に、データソースビューを作成します。
- [Solution Explorer] で[Data Source Views] を右クリックし、[New Data Source View] を選択します。
- 先ほど作成したデータソース(CData Redshift Source) を選択し、[Next] をクリックします。
- 基になるデータソースのパターンに一致する外部キーを選択し、[Next] をクリックします。
- Redshift の表を選択、ビューに追加し、[Next] をクリックします。
- ビューに名前を付け、[Finish] をクリックします。
スキームに一致する外部キーに基づいて、基礎的なデータとのリレーションが検出されます。[Data Source View] をダブルクリックすることで、これらのリレーションを確認・編集することができます。
[Data Source View] へのセカンダリデータソースの追加はサポートされないことに注意してください。複数のデータソースを利用する場合、SSAS は、すべてのソースがADO.NET プロバイダーでは使用できないOpenRowset 経由のリモートクエリをサポートすることを必要とします。
Redshift 用のキューブを作成する
プロジェクトを処理してRedshift をSSAS に展開するための最後のステップはキューブの作成です。
- [Solution Explorer] の[Cubes] を右クリックし、[New Cube] を選択します。
- [Use existing tables] を選択し、[Next] をクリックします。
- メジャーグループテーブルに使用するテ-ブルを選択し、[Next] をクリックします。
- キューブに含ませたいメジャーを選択し、[Next] をクリックします。
- 使用可能なテーブルに基づいて作成するディメンションを選択し、[Next] をクリックします。
- すべての選択内容を確認し、[Finish] をクリックします。
プロジェクトを処理する
データソースと、データソースビュー、キューブを作成すると、SSASにキューブを展開する準備が完了します。ターゲットサーバーとデータベースを構成するために、プロジェクトを右クリックしプロパティを選択します。デプロイメントに移動し、ターゲットセクションでサーバーとデータベースのプロパティを設定します。
ターゲットサーバーとデータベースを構成した後、プロジェクトを右クリックして[Process] を選択します。このステップの一部として、プロジェクトの構成・デプロイが必要となる場合があります。プロジェクトを構成・デプロイし、[Process Database]ウィザードにある[Run] をクリックします。
SSAS インスタンスにRedshift 用のOLAP キューブが作成され、分析、レポート、表示の準備が完了します。Redshift 用のCData ADO.NET プロバイダーの30日の無償評価版をダウンロードして、SSAS データをご利用ください。