【徹底解説】Amazon Athena のデータをSQL Server のリンクサーバーにノーコードで連携する方法

兵藤朋代
兵藤朋代
コンテンツスペシャリスト
業務で利用しているSQL Server にAmazon Athena のデータを統合したい方向けに、リンクサーバーを活用したアプローチを紹介。CData ODBC DriverのSQL Gateway 機能を使うことで3ステップ設定。使い慣れたSQL Server からAmazon Athena データに手軽にアクセスできるようになります。



本記事では、SQL ServerのTDS Remoting 機能を使ってAmazon Athena にリンクサーバーとしてシームレスに連携する方法を解説します。この連携には、CData ODBC Driverに同梱されているSQL Gateway を使用します。この方法により、SQL Server のインターフェースからAmazon Athena への読み書き双方向のアクセスが可能になり、既存のSQL Server 環境で外部データを活用できるようになります。スクリーンショット付きで紹介していくので、初心者の方でも簡単に設定できます!

Amazon Athena をSQL Server のリンクサーバーとして利用する3つの主要シナリオ

  • SQL Server に接続しているアプリケーションでAmazon Athena のデータを利用したいがデータ接続を増やしたくない
  • Amazon Athena のデータをSQL Server のデータや他のリンクサーバーのデータをJOIN などして使いたい
  • 利用したいミドルウェア・BI ツールなどにODBC やJDBC の汎用のインターフェースがないが、SQL Server には接続できる

【準備編】Amazon Athena ODBC DSNの設定方法

まずは、本記事右側のサイドバーからAmazonAthena ODBC Driver の無償トライアルをダウンロード・インストールしてください。ODBC ドライバーのインストール完了時にODBC DSN 設定画面が立ち上がります。または、Microsoft ODBC データソースアドミニストレーターを使ってDSN を作成および設定できます。

Amazon Athena 接続プロパティの取得・設定方法

それでは、早速Athena に接続していきましょう。

データに接続するには、以下の接続パラメータを指定します。

  • DataSource:接続するAmazon Athena データソース。
  • Database:接続するAmazon Athena データベース。
  • AWSRegion:Amazon Athena データがホストされているリージョン。
  • S3StagingDirectory:クエリの結果を保存するS3 フォルダ。

Database またはDataSource が設定されていない場合、CData 製品はAmazon Athena の利用可能なデータソースからすべてのデータベースのリスト化を試みます。そのため、両方のプロパティを設定することでCData 製品のパフォーマンスが向上します。

Amazon Athena の認証設定

CData 製品は幅広い認証オプションに対応しています。詳しくはヘルプドキュメントの「はじめに」を参照してみてください。

AWS キーを取得

IAM ユーザーの認証情報を取得するには、以下のステップお試しください。

  1. IAM コンソールにサインインします。
  2. ナビゲーションペインでユーザーを選択します。
  3. ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してからセキュリティ認証情報タブに移動します。

AWS ルートアカウントの資格情報を取得するには、以下のステップをお試しください。

  1. ルートアカウントの認証情報を使用してAWS 管理コンソールにサインインします。
  2. アカウント名または番号を選択します。
  3. 表示されたメニューでMy Security Credentials を選択します。
  4. ルートアカウントのアクセスキーを管理または作成するには、Continue to Security Credentials をクリックし、[Access Keys]セクションを展開します。

その他の認証オプションについては、ヘルプドキュメントの「Amazon Athena への認証」を参照してください。

【設定手順1】SQL Gateway でAmazon Athena ODBC DSN をセットアップする方法

CData ODBC ドライバにはSQL Gateway が同梱されています。このSQL Gateway に、Amazon Athena ODBC Driver をサービスとして設定します。

  1. 「スタート」画面から「SQL Gateway」を起動します。青い「C」のSQL Gateway ロゴが右下のインジケータに表示されます。 アプリケーションコンソールが開かない場合には、SQL Gateway アイコンを右クリックして、「Open Application」をクリックしてください。
  2. アプリケーションコンソールの「Service」タブを開いて、「Add」をクリックして、新しいODBC データソースを設定します。
  3. Amazon Athena ODBC の設定を行います。
    サービス名:任意
    リモーティングDB:TD(SQL Server)を選択
    データソース:ドロップダウンでCData Amazon Athena Source Sys を選択
    ポート:使用していないポートを選択
    CData Amazon Athena ODBC Driver設定画面 - SQL Gatewayでの設定方法
  4. 次に「ユーザー」タブ→「追加」からユーザーを登録します。
    ユーザー毎にFull アクセスか、Readonly か、None の権限を選択できます。
    複数のODBC データソースがある場合には、データソース毎に権限の設定が可能です。
    SQL Gateway ユーザー権限設定画面 - Amazon Athenaデータアクセス権限の設定方法
    「OK」を押して、ユーザー登録を完了します。 その後「変更を保存」で設定を保存します。
  5. SQL Gateway の「サービス」タブで「開始」ボタンを押して、サービスを起動します。サービスの左側の〇が緑色になれば、サービスは起動中です。

【設定手順2】SQL Server でAmazon Athena リンクサーバーを構築する方法

SQL Gateway 側でサービスの設定が終わったら、SQL Server 側でAmazon Athena サービスをリンクサーバーとして使う設定をしましょう。

  1. SQL Server Management Studio (SSMS) を開きます。
    オブジェクトエクスプローラーの「サーバーオブジェクト」で「リンクサーバー」を右クリックして、「新しいリンクサーバー」をクリックします。
  2. 新しいリンクサーバーの設定画面の「全般」で、以下を入力します。
    サーバー種類:その他データソース
    プロバイダー:Microsoft OLE DB Driver for SQL Server
    データソース:この例の場合、localhost, 1433
    カタログ:ODBC DSN 名を入力
    SQL Server リンクサーバー設定画面 - Amazon Athenaをリンクサーバーとして追加する方法
  3. また、「セキュリティ」では、「このセキュリティコンテキスト」を選択して、リモートログインにSQL Gateway にユーザー設定したUser 名とPassword を入力します。

これで、リンクサーバーの設定は終わりなので、「OK」を押して設定を保存します。

【活用例1】SSMS(SQL Server Management Studio)でAmazon Athena データを操作する方法

SSMS のオブジェクトエクスプローラーのリンクサーバー下にAmazon Athena のリンクサーバーが作成され、「テーブル」下にAmazon Athena のデータがアプリ単位でテーブルが生成されます。
新しいクエリを選択し、Amazon Athena のデータを取得してみます。

実践的なSQL クエリの例と解説

SELECT * from リンクサーバー名.CData Amazon Athena Source Sys(ODBC DSN 名).Amazon Athena.テーブル名

このように、API のリクエストではなく通常のSQL 構文でデータを扱うことが可能になっています

【活用例2】Visual Studio からAmazon Athena のリンクサーバーに連携する方法

Visual Studio のサーバーエクスプローラーの「データ接続」を右クリックし、「接続の追加」をクリックして、データソースの選択画面を開きます。 データソースの選択画面でデータソースを「Microsoft SQL Server 」に選択して、「続行」を押します。

Visual Studio での接続設定とクエリ実行手順

「接続の追加」画面で、以下を入力します。
サーバー名:SQL Server のサーバー名
認証:任意の認証方式
データベース名の選択または入力:※master など
※リンクサーバーを直接データベース名として入力することはできないようです。なので上位のデータベース名で設定しておきます。

Visual Studio でのAmazon Athenaリンクサーバー接続設定画面 - データ連携の設定方法

「テスト接続」をして大丈夫であれば、「OK」を押して設定を完了させます。

「新しいクエリ」で、SQL でSELECT 文を書いてデータを取得してみます。

SELECT * from リンクサーバー名.CData Amazon Athena Source Sys(ODBC DSN 名).Amazon Athena.テーブル名

このように、通常のSQL Server のリンクサーバーと同じようにVisual Studio 内Amazon Athena のデータを扱うことが可能になります。 他のIDE でもSQL Server にアクセスする方法でAmazon Athena のデータにSQL でアクセスが可能になります。
複数データソースのJOIN などを行う場合には大変便利です。

【応用編】Amazon Athena データとSQL Server データを組み合わせた高度な活用例

リンクサーバーの真価は、異なるデータソースを組み合わせた分析や処理にあります。以下に実践的な活用例をご紹介します。

複数データソースの結合(JOIN)によるデータ統合

SELECT
  s.customer_id,
  s.customer_name,
  o.order_id,
  o.order_date,
  o.total_amount
FROM
  Sales.Customers s
JOIN
  リンクサーバー名.CData Amazon Athena Source Sys.Amazon Athena.Orders o
ON
  s.customer_id = o.customer_id
WHERE
  o.order_date > '2023-01-01'
ORDER BY
  o.total_amount DESC

このクエリ例では、SQL Server内の顧客データとAmazon Athena 内の注文データを顧客IDで結合し、2023年以降の注文を金額順に表示しています。

おわりに

このようにCData ODBC ドライバと併用することで、Amazon Athena を含む270を超えるSaaS、NoSQL データをSQL Server に連携できます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービ スやNoSQL と合わせて活用してみてください。

はじめる準備はできましたか?

Amazon Athena ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Amazon Athena Icon Amazon Athena ODBC Driver お問い合わせ

Amazon Athena ODBC Driver は、ODBC 接続をサポートする任意のアプリケーションからAmazon Athena のライブデータに直接接続できるパワフルなツールです。

標準のODBC Driver インターフェースを使用して、データベースのようにインタラクティブなクエリサービスAmazon Athena データにアクセスします。