Amazon Athena のデータを IBM SPSS Modeler にシームレスにインポート

Mohsin Turki
Mohsin Turki
Technical Marketing Engineer
CData ODBC Driver を使用して Amazon Athena のデータを IBM SPSS Modeler に統合し、リアルタイムのインサイトと高度なデータ分析を実現します。

IBM SPSS Modeler は、組織がデータから価値あるインサイトを抽出できる強力なデータマイニング・予測分析プラットフォームです。CData ODBC Driver for Amazon Athena を介してAmazon Athena のデータを SPSS Modeler に接続することで、高度なデータマイニング、予測モデリング、統計分析のためのリアルタイムアクセスを活用できます。

このガイドでは、IBM SPSS Modeler をAmazon Athena のデータに接続し、シームレスなデータのインポート、準備、分析を行う手順を説明します。CData ODBC Driver for Amazon Athena を使用して、IBM SPSS Modeler でAmazon Athena のデータの可能性を最大限に引き出し、実用的なインサイトを得ましょう。

Amazon Athena データ連携について

CData は、Amazon Athena のライブデータにアクセスし、統合するための最も簡単な方法を提供します。お客様は CData の接続機能を以下の目的で使用しています:

  • IAM 認証情報、アクセスキー、インスタンスプロファイルなど、さまざまな方法で安全に認証できます。多様なセキュリティニーズに対応し、認証プロセスを簡素化します。
  • 詳細なエラーメッセージにより、セットアップを効率化し、問題を迅速に解決できます。
  • サーバーサイドでのクエリ実行により、パフォーマンスを向上させ、クライアントリソースへの負荷を最小限に抑えます。

ユーザーは、Tableau、Power BI、Excel などの分析ツールと Athena を統合し、お気に入りのツールから詳細な分析を行うことができます。

CData を使用した Amazon Athena のユニークなユースケースについては、ブログ記事をご覧ください:https://jp.cdata.com/blog/amazon-athena-use-cases


はじめに


概要

手順の概要は以下のとおりです:

  1. ODBC ドライバーの設定:CData ODBC Driver for Amazon Athena で必要な接続プロパティを入力し、Amazon Athena のデータ への接続を設定します。
  2. SPSS Modeler での ODBC 接続のセットアップ:IBM SPSS Modeler で、設定済みの DSN を選択して ODBC 接続を確立します。
  3. データのインポートと処理:Amazon Athena のデータ を SPSS Modeler にインポートし、データの確認、フィルタリング、変換、準備を行って、予測分析や統計モデリングに活用します。

CData ODBC Driver を使用した Amazon Athena DSN の設定

まず、CData ODBC Driver を使用してシステムにAmazon Athena のデータ用の DSN(データソース名)を設定します。こちらから全機能を備えた 30 日間の無料トライアルをダウンロードしてインストールしてください。

インストールが完了したら、ODBC データソースアドミニストレーターを起動します:

  • Windows の場合:スタートメニューで ODBC データソースアドミニストレーター を検索してアプリケーションを開きます。
  • Mac の場合:アプリケーションからユーティリティを開き、ODBC Manager を選択します。
  • Linux の場合:コマンドラインから ODBC Data Source Administrator を起動するか、インストールされている場合は unixODBC を使用します。

起動したら、CDataAmazon Athena のデータSource をダブルクリックし、接続に必要な値を入力します:

Amazon Athena 接続プロパティの取得・設定方法

それでは、早速Athena に接続していきましょう。

データに接続するには、以下の接続パラメータを指定します。

  • DataSource:接続するAmazon Athena データソース。
  • Database:接続するAmazon Athena データベース。
  • AWSRegion:Amazon Athena データがホストされているリージョン。
  • S3StagingDirectory:クエリの結果を保存するS3 フォルダ。

Database またはDataSource が設定されていない場合、CData 製品はAmazon Athena の利用可能なデータソースからすべてのデータベースのリスト化を試みます。そのため、両方のプロパティを設定することでCData 製品のパフォーマンスが向上します。

Amazon Athena の認証設定

CData 製品は幅広い認証オプションに対応しています。詳しくはヘルプドキュメントの「はじめに」を参照してみてください。

AWS キーを取得

IAM ユーザーの認証情報を取得するには、以下のステップお試しください。

  1. IAM コンソールにサインインします。
  2. ナビゲーションペインでユーザーを選択します。
  3. ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してからセキュリティ認証情報タブに移動します。

AWS ルートアカウントの資格情報を取得するには、以下のステップをお試しください。

  1. ルートアカウントの認証情報を使用してAWS 管理コンソールにサインインします。
  2. アカウント名または番号を選択します。
  3. 表示されたメニューでMy Security Credentials を選択します。
  4. ルートアカウントのアクセスキーを管理または作成するには、Continue to Security Credentials をクリックし、[Access Keys]セクションを展開します。

その他の認証オプションについては、ヘルプドキュメントの「Amazon Athena への認証」を参照してください。

IBM SPSS Modeler での ODBC 接続のセットアップ

DSN の設定が完了したら、IBM SPSS Modeler で接続を行います:

  • IBM SPSS Modeler を起動し、ログインして新しいストリームを作成します。
  • Sources パレットから Database ノードを見つけ、キャンバスにドラッグします。
  • Database ノードをダブルクリックして設定ダイアログを開きます。 を選択し、設定済みの DSN を参照して選択し、OK をクリックします。
  • Database ダイアログで、インポートしたいテーブルを参照して選択し、データをプレビューして、OK をクリックして確定します。

これで IBM SPSS Modeler でAmazon Athena のデータを処理・分析する準備が整いました。


データ処理:フィルタ、カテゴリ、モデル

テーブルをインポートしたら、SPSS Modeler でAmazon Athena のデータの絞り込み、フィルタリング、カテゴリ分け、モデリングを行えます:

  • フィルタリング:Database 接続をダブルクリックし、Filter セクションでフィールドを選択/解除して、関連するデータに絞り込みます。これにより処理速度とモデル精度が向上します。
  • データ型とロールの設定:Types セクションでフィールドをカテゴリ分けし、各データ型にロールを割り当てます。
  • 基本的な分析の実行:Analysis ノードを Database ノードの隣にドラッグアンドドロップして接続し、Play ボタンをクリックしてストリームを実行しデータを分析します。

これで簡単な分析が完了し、SPSS Modeler がデータベースからのインサイトを処理・表示できるようになりました。


CData で Amazon Athena データの可能性を引き出す

CData ODBC Driver for Amazon Athena を使用すれば、Amazon Athena のデータ を IBM SPSS Modeler にシームレスに接続できます。今すぐ無料トライアルを開始して、リアルタイムデータの可能性を最大限に活用し、高度な分析と意思決定に役立てましょう。

はじめる準備はできましたか?

Amazon Athena ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Amazon Athena Icon Amazon Athena ODBC Driver お問い合わせ

Amazon Athena ODBC Driver は、ODBC 接続をサポートする任意のアプリケーションからAmazon Athena のライブデータに直接接続できるパワフルなツールです。

標準のODBC Driver インターフェースを使用して、データベースのようにインタラクティブなクエリサービスAmazon Athena データにアクセスします。