SAS Viya で Amazon Athena のリアルタイムデータを分析

Dibyendu Datta
Dibyendu Datta
Lead Technology Evangelist
CData Connect AI を使用して SAS Viya からAmazon Athena のデータに接続し、リアルタイムデータでセルフサービス分析を実現する方法を解説します。

SAS Viya は、データ管理、機械学習、分析を強化し、効率的な意思決定とインサイトの創出を促進する分析プラットフォームです。CData Connect AI と組み合わせることで、クラウド間でリアルタイムにAmazon Athena のデータにアクセスし、予測モデルの構築やデータドリブンな意思決定のためのインサイト作成など、さまざまな用途に活用できます。この記事では、SAS Viya クラウドプラットフォームから Connect AI に接続し、セルフサービス AI と分析のデプロイメントにAmazon Athena のデータを統合する方法をご紹介します。

CData Connect AI は、Amazon Athena 向けに純粋な SQL インターフェースをクラウド間で提供します。これにより、データをレプリケーションすることなく、SAS Viya でAmazon Athena のデータに簡単に接続できます。Connect AI は SAS Viya からは SQL Server データベースとまったく同じように見え、フィルタや JOIN などの SQL 操作をAmazon Athenaに直接プッシュする最適化されたデータ処理により、サーバーサイド処理を活用してAmazon Athena のデータをすばやく取得します。

Amazon Athena データ連携について

CData は、Amazon Athena のライブデータにアクセスし、統合するための最も簡単な方法を提供します。お客様は CData の接続機能を以下の目的で使用しています:

  • IAM 認証情報、アクセスキー、インスタンスプロファイルなど、さまざまな方法で安全に認証できます。多様なセキュリティニーズに対応し、認証プロセスを簡素化します。
  • 詳細なエラーメッセージにより、セットアップを効率化し、問題を迅速に解決できます。
  • サーバーサイドでのクエリ実行により、パフォーマンスを向上させ、クライアントリソースへの負荷を最小限に抑えます。

ユーザーは、Tableau、Power BI、Excel などの分析ツールと Athena を統合し、お気に入りのツールから詳細な分析を行うことができます。

CData を使用した Amazon Athena のユニークなユースケースについては、ブログ記事をご覧ください:https://jp.cdata.com/blog/amazon-athena-use-cases


はじめに


Amazon Athena への接続を設定(SAS Viya 向け)

SAS Viya から Amazon Athena への接続は、CData Connect AI を介して行います。それでは、Amazon Athena のデータを SAS Viya から利用できるようにするため、Amazon Athena への接続を作成していきましょう。

  1. Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
  2. 接続を追加パネルから「Amazon Athena」を選択
  3. Amazon Athena に接続するために必要な認証プロパティを入力します。

    Amazon Athena 接続プロパティの取得・設定方法

    それでは、早速Athena に接続していきましょう。

    データに接続するには、以下の接続パラメータを指定します。

    • DataSource:接続するAmazon Athena データソース。
    • Database:接続するAmazon Athena データベース。
    • AWSRegion:Amazon Athena データがホストされているリージョン。
    • S3StagingDirectory:クエリの結果を保存するS3 フォルダ。

    Database またはDataSource が設定されていない場合、CData 製品はAmazon Athena の利用可能なデータソースからすべてのデータベースのリスト化を試みます。そのため、両方のプロパティを設定することでCData 製品のパフォーマンスが向上します。

    Amazon Athena の認証設定

    CData 製品は幅広い認証オプションに対応しています。詳しくはヘルプドキュメントの「はじめに」を参照してみてください。

    AWS キーを取得

    IAM ユーザーの認証情報を取得するには、以下のステップお試しください。

    1. IAM コンソールにサインインします。
    2. ナビゲーションペインでユーザーを選択します。
    3. ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してからセキュリティ認証情報タブに移動します。

    AWS ルートアカウントの資格情報を取得するには、以下のステップをお試しください。

    1. ルートアカウントの認証情報を使用してAWS 管理コンソールにサインインします。
    2. アカウント名または番号を選択します。
    3. 表示されたメニューでMy Security Credentials を選択します。
    4. ルートアカウントのアクセスキーを管理または作成するには、Continue to Security Credentials をクリックし、[Access Keys]セクションを展開します。

    その他の認証オプションについては、ヘルプドキュメントの「Amazon Athena への認証」を参照してください。

  4. 「Save & Test」をクリック
  5. Amazon Athena 接続の追加ページで「Permissions」タブに移動し、ユーザーベースの権限を更新します。

パーソナルアクセストークンを追加

REST API、OData API、または仮想 SQL Server を通じて Connect AI に接続する場合は、パーソナルアクセストークン(PAT)を使用して認証を行います。アクセス管理を細かく制御するため、サービスごとに個別の PAT を作成することをお勧めします。

  1. Connect AI アプリの右上にある歯車アイコン()をクリックして設定ページを開きます。
  2. 設定ページで「Access Tokens」セクションに移動し、「 Create PAT」をクリックします。
  3. PAT に名前を付けて「Create」をクリックします。
  4. パーソナルアクセストークンは作成時にのみ表示されます。必ずコピーして、今後の利用のために安全に保管してください。

接続の設定と PAT の生成が完了したら、SAS Viya からAmazon Athena のデータに接続する準備は完了です。

SAS Viya から CData Connect AI に接続

以下の手順で、CData Connect AI で確立した接続を使用して Amazon Athena から SAS Viya にデータを読み込む方法を説明します。

  1. CData Connect AI JDBC ドライバーをダウンロードしてインストールします。
    • CData Connect AI の Integrations ページを開きます。
    • JDBC を検索して選択します。
    • セットアップファイルをダウンロードして実行します。
    • インストールが完了すると、JAR ファイルはインストールディレクトリ(lib フォルダ内)に配置されます。
  2. SAS Viya にログインし、左上の Applications Menu に移動します。
  3. Analytics Life Cycle トピックから Develop Code and Flows を選択します。
  4. Explorer タブに移動し、左パネルの SAS Server をクリックします。
  5. 以下の手順で CData Connect JDBC ドライバーの JAR ファイルをアップロードします。
    • 「Home」ディレクトリを右クリックします。
    • Upload files をクリックします。
    • 指定された場所に JAR ファイルを配置し、ファイルパスをメモします。
  6. 完了したら、Libraries タブに移動し、CData Connect JDBC 用の Create a new library connection(以下に示すように左上隅)をクリックします。
  7. ライブラリ接続設定を入力します。
    • Connection name: 接続の名前を入力
    • Library name (libref): ライブラリの参照名を入力
    • Library type: 「SAS/ACCESS to JDBC」を選択
  8. Properties タブをクリックし、Library attributesREADONLY に設定します。
  9. 「Connection Options」タブをクリックし、以下の詳細を入力します。
    • Hive JDBC driver's class name: cdata.jdbc.connect.ConnectDriver
    • Java CLASSPATH: JAR ドライバーファイルへのファイルパスを入力(手順 5 を参照)
  10. Test connection をクリックします。成功したら、Save and connect をクリックします。
  11. をクリックして新しいタブを追加し、SAS program を選択します。
  12. 以下のコードブロックに設定パラメータを入力します。
    • Libref: 手順 9 で定義したライブラリ参照名を入力
    • ClassPath: JAR ドライバーファイルへのファイルパスを入力
    • Username: CData Connect のユーザー名を入力。CData Connect インターフェースの右上に表示されています(例: test@cdata.com
    • DefaultCatalog: クエリを実行したい CData Connect AI で設定した接続を入力
    • Password: 「パーソナルアクセストークンを追加」セクションで生成した PAT を入力
    libname [Libref] JDBC
    classpath=[ClassPath]
    class="cdata.jdbc.connect.ConnectDriver"
    URL="jdbc:Connect:AuthScheme=Basic;User=[Username];DefaultCatalog=[DefaultCatalog];DefaultSchema=dbo;Password=[PAT]";
    
    proc sql;
    
    SELECT * FROM [Libref].MyTable;
    
    quit;
    
  13. Run をクリックします。CData Connect AI から SAS Viya にデータが読み込まれるのを確認できます。

クラウドアプリケーションから Amazon Athena へのリアルタイムアクセス

これで、SAS Viya からAmazon Athena のデータへのダイレクトなクラウド間接続が完成しました。データをレプリケーションすることなく、予測モデルの構築、データドリブンな意思決定のためのインサイト作成など、さまざまな用途に活用できます。

Connect AI をお試しいただき、300 以上の SaaS、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスをクラウドアプリケーションから直接実現してください。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ