Tableau で Amazon Athena のデータ のデータを可視化
CData Drivers for Amazon Athena を使用すると、標準データアクセス方法でビジネスインテリジェンスツール(Tableau など)と Amazon Athena のデータを接続できます。 CData JDBC Driver for Amazon Athena は Windows およびMacOS 上のTableau からの接続をサポートします。この記事では、スキーマの検出と Amazon Athena のデータ データへのリアルタイムクエリの実行方法について説明します。
NOTE: Tableau 2020.3 以上をご利用の場合は、CData Tableau Connector もご利用いただけます。 Tableau Cloud で Amazon Athena のデータ に接続する場合は、CData Connect AI をご利用ください。
Amazon Athena データ連携について
CData は、Amazon Athena のライブデータにアクセスし、統合するための最も簡単な方法を提供します。お客様は CData の接続機能を以下の目的で使用しています:
- IAM 認証情報、アクセスキー、インスタンスプロファイルなど、さまざまな方法で安全に認証できます。多様なセキュリティニーズに対応し、認証プロセスを簡素化します。
- 詳細なエラーメッセージにより、セットアップを効率化し、問題を迅速に解決できます。
- サーバーサイドでのクエリ実行により、パフォーマンスを向上させ、クライアントリソースへの負荷を最小限に抑えます。
ユーザーは、Tableau、Power BI、Excel などの分析ツールと Athena を統合し、お気に入りのツールから詳細な分析を行うことができます。
CData を使用した Amazon Athena のユニークなユースケースについては、ブログ記事をご覧ください:https://jp.cdata.com/blog/amazon-athena-use-cases
はじめに
Tableau で Amazon Athena に接続
Tableau を起動する前に、.jar ファイルが正しいフォルダに配置されていることを確認してください。
- Windows: C:\Program Files\Tableau\Drivers
- MacOS: ~/Library/Tableau/Drivers
.jar ファイルを配置したら、すぐに接続を確立できます。
- Tableau を起動します。
- サーバーへ で その他 を選択します。
- その他のデータベース (JDBC) を選択します。
- URL フィールドに JDBC 接続文字列を入力します。
- DataSource:接続するAmazon Athena データソース。
- Database:接続するAmazon Athena データベース。
- AWSRegion:Amazon Athena データがホストされているリージョン。
- S3StagingDirectory:クエリの結果を保存するS3 フォルダ。
- IAM コンソールにサインインします。
- ナビゲーションペインでユーザーを選択します。
- ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してからセキュリティ認証情報タブに移動します。
- ルートアカウントの認証情報を使用してAWS 管理コンソールにサインインします。
- アカウント名または番号を選択します。
- 表示されたメニューでMy Security Credentials を選択します。
- ルートアカウントのアクセスキーを管理または作成するには、Continue to Security Credentials をクリックし、[Access Keys]セクションを展開します。
- サインイン をクリックします。
Amazon Athena 接続プロパティの取得・設定方法
それでは、早速Athena に接続していきましょう。
データに接続するには、以下の接続パラメータを指定します。
Database またはDataSource が設定されていない場合、CData 製品はAmazon Athena の利用可能なデータソースからすべてのデータベースのリスト化を試みます。そのため、両方のプロパティを設定することでCData 製品のパフォーマンスが向上します。
Amazon Athena の認証設定
CData 製品は幅広い認証オプションに対応しています。詳しくはヘルプドキュメントの「はじめに」を参照してみてください。
AWS キーを取得
IAM ユーザーの認証情報を取得するには、以下のステップお試しください。
AWS ルートアカウントの資格情報を取得するには、以下のステップをお試しください。
その他の認証オプションについては、ヘルプドキュメントの「Amazon Athena への認証」を参照してください。
組み込みの接続文字列デザイナー
JDBC URL の構成を簡単にするには、Amazon Athena JDBC Driver に組み込まれている接続文字列デザイナーをご利用ください。.jar ファイルをダブルクリックするか、コマンドラインから実行します。
Windows の場合:
java -jar 'C:\Program Files\CData[product_name]\lib\cdata.jdbc.amazonathena.jar'
MacOS の場合:
java -jar cdata.jdbc.amazonathena.jar
接続プロパティを設定し、接続文字列をクリップボードにコピーします。
JDBC URL を構成する際に、Max Rows 接続プロパティの設定をお勧めします。返される行数が制限されるため、特にレポートやビジュアライゼーションの設計時にパフォーマンスが向上します。
以下は、デザイナーで作成したサンプル URL です。
jdbc:amazonathena:AccessKey='a123';SecretKey='s123';Region='IRELAND';Database='sampledb';S3StagingDirectory='s3://bucket/staging/';
スキーマの検出とデータクエリ
- データベース プルダウンメニューから CData を選択します。
- スキーマ プルダウンメニューから CData を選択します。
- テーブルを結合エリアにドラッグします。複数のテーブルを含めることができます。
- 今すぐ更新 または 自動更新 を選択します。「今すぐ更新」はデータソースの最初の10,000 行をプレビューします(行数はRows テキストボックスで変更可能)。「自動更新」はプレビューエリアの変更を自動的に反映します。
- 「接続」メニューで ライブ オプションを選択すると、Tableau にデータのコピーをロードせず、リアルタイムデータを直接操作できます。
- ワークシートのタブをクリックします。カラムはデータ型に応じて「ディメンション」と「メジャー」に分類されます。CData ドライバーはデータ型を自動で検出するため、Tableau の強力なデータ処理および可視化機能を活用できます。
- ディメンション または メジャー エリアからフィールドを 行 または 列 にドラッグします。Tableau がカラムまたは行のヘッダーを作成します。
- 表示形式 タブからグラフの種類を選択します。選択したグラフが Tableau に表示されます。
CData JDBC Driver for Amazon Athena と Tableau を使用して、Amazon Athena のデータ に対する堅牢なビジュアライゼーションとレポートを簡単に作成できます。30日間の無償トライアルをダウンロードして、今すぐお試しください。