Jaspersoft Studio から Amazon Athena のデータに接続

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Jaspersoft Studio でAmazon Athena のデータにSQL を実行。

この記事では、CData JDBC Driver for Amazon Athena を使って、Jaspersoft Studio からAmazon Athena に標準JDBC データソースとして接続する方法を説明します。標準のJaspersoft ウィザードを使ってAmazon Athena へのSQL クエリを作成していきます。クエリは直接Amazon Athena API に実行されるため、Amazon Athena のデータへのリアルタイム接続が可能になります。

Amazon Athena データ連携について

CData は、Amazon Athena のライブデータにアクセスし、統合するための最も簡単な方法を提供します。お客様は CData の接続機能を以下の目的で使用しています:

  • IAM 認証情報、アクセスキー、インスタンスプロファイルなど、さまざまな方法で安全に認証できます。多様なセキュリティニーズに対応し、認証プロセスを簡素化します。
  • 詳細なエラーメッセージにより、セットアップを効率化し、問題を迅速に解決できます。
  • サーバーサイドでのクエリ実行により、パフォーマンスを向上させ、クライアントリソースへの負荷を最小限に抑えます。

ユーザーは、Tableau、Power BI、Excel などの分析ツールと Athena を統合し、お気に入りのツールから詳細な分析を行うことができます。

CData を使用した Amazon Athena のユニークなユースケースについては、ブログ記事をご覧ください:https://jp.cdata.com/blog/amazon-athena-use-cases


はじめに


Amazon Athena のデータにJDBC データソースとして接続

Jaspersoft Studio でJDBC データソースを作成するには、データアダプタを作成します。

  1. Repository Explorer ビューで、Data Adapters ノードを右クリックし、Create Data Adapter をクリックします。
  2. Database JDBC Connection を選択します。
  3. ドライバーのわかりやすい名前を入力します。
  4. Driver Classpath タブで、Add をクリックします。表示されたダイアログで、インストールディレクトリのlib サブフォルダに移動し、ドライバーJAR を選択します。
  5. Database Location タブで、JDBC ドライバーのクラス名を入力します:cdata.jdbc.amazonathena.AmazonAthenaDriver
  6. JDBC URL を入力します。

    Amazon Athena 接続プロパティの取得・設定方法

    それでは、早速Athena に接続していきましょう。

    データに接続するには、以下の接続パラメータを指定します。

    • DataSource:接続するAmazon Athena データソース。
    • Database:接続するAmazon Athena データベース。
    • AWSRegion:Amazon Athena データがホストされているリージョン。
    • S3StagingDirectory:クエリの結果を保存するS3 フォルダ。

    Database またはDataSource が設定されていない場合、CData 製品はAmazon Athena の利用可能なデータソースからすべてのデータベースのリスト化を試みます。そのため、両方のプロパティを設定することでCData 製品のパフォーマンスが向上します。

    Amazon Athena の認証設定

    CData 製品は幅広い認証オプションに対応しています。詳しくはヘルプドキュメントの「はじめに」を参照してみてください。

    AWS キーを取得

    IAM ユーザーの認証情報を取得するには、以下のステップお試しください。

    1. IAM コンソールにサインインします。
    2. ナビゲーションペインでユーザーを選択します。
    3. ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してからセキュリティ認証情報タブに移動します。

    AWS ルートアカウントの資格情報を取得するには、以下のステップをお試しください。

    1. ルートアカウントの認証情報を使用してAWS 管理コンソールにサインインします。
    2. アカウント名または番号を選択します。
    3. 表示されたメニューでMy Security Credentials を選択します。
    4. ルートアカウントのアクセスキーを管理または作成するには、Continue to Security Credentials をクリックし、[Access Keys]セクションを展開します。

    その他の認証オプションについては、ヘルプドキュメントの「Amazon Athena への認証」を参照してください。

    組み込みの接続文字列デザイナー

    JDBC URL の構成をサポートするために、Amazon Athena JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。

    java -jar cdata.jdbc.amazonathena.jar
    

    接続プロパティに値を入力して、接続文字列をクリップボードにコピーします。

    JDBC URL を構成する際に、Max Rows 接続プロパティも設定できます。これにより返される行数が制限され、レポートやビジュアライゼーションの設計時のパフォーマンス向上に役立ちます。

    以下はAmazon Athena の一般的なJDBC URL です:

    jdbc:amazonathena:AccessKey='a123';SecretKey='s123';Region='IRELAND';Database='sampledb';S3StagingDirectory='s3://bucket/staging/';
    

Amazon Athena のデータでレポートを作成

以下のステップに従って、Amazon Athena へのSQL クエリを作成します。これはシンプルなレポートの基礎となります。

  1. File -> New Jasper Report をクリックします。テンプレートを選択し、親プロジェクトを選択して、レポートファイルを指定します。
  2. Data Adapter メニューで、前のセクションで作成したデータアダプタを選択します。
  3. Diagram タブで、テーブルをボックスにドラッグして、使用したいカラムをクリックします。または、Texts タブでカスタムクエリを入力します。例:
    SELECT Name, TotalDue FROM Customers
    
  4. データセットに含めるフィールドを選択します。この例では、すべてのフィールドを使用します。
  5. Group By ステップをスキップして、ウィザードを完了します。

Preview タブで、現在のAmazon Athena のデータでレポートがどのように表示されるかをプレビューできます。

チャートを作成

以下のセクションでは、独自のSQL クエリに紐づいたチャートを作成する方法を説明します。リモートデータソースからデータを取得する際、特定のレポートオブジェクト用に作成したより制限的なクエリを使用すると、パフォーマンスが向上する場合があります。

DataSet を作成

以下のステップに従って、チャートを入力する新しいデータセットを作成します。

  1. レポートの編集エリアで、Design タブをクリックします。
  2. Outline ビューで、レポートのルートノードを右クリックし、Create Dataset をクリックします。
  3. データセットの名前を入力し、接続またはデータソースから新しいデータセットを作成するオプションをクリックします。
  4. Data Adapter メニューで、最初のセクションで作成したデータアダプタを選択します。
  5. 次のようなクエリを入力します:
    SELECT Name, TotalDue FROM Customers
    
  6. データセットに含めるフィールドを選択します。この例ではName とTotalDue を使用します。
  7. フィールドによるグループ化のステップをスキップして、ウィザードを完了します。

チャートを構成

データセットを追加した後、以下のステップに従ってチャートウィザードでカラム値をチャートの軸にマッピングします。

  1. Outline ビューでSummary ノードをクリックします。Properties ビューで、高さを400ピクセルに設定します。Summary バンドはレポートの最後に印刷されます。
  2. パレットからチャートをSummary にドラッグします。チャートウィザードが表示されます。
  3. チャートのタイプを選択します。この例では棒グラフを使用します。
  4. Dataset メニューで、チャート用に作成したデータセットを選択します。
  5. Dataset タブで、マスターレポートの入力に使用されたものと同じJDBC 接続を使用するオプションを選択します。
  6. チャートのシリーズを指定します:Series メニューの横にあるボタンをクリックし、Add をクリックします。表示されたExpression Editor で、Name カラムをダブルクリックして、式を$F{Name} に設定します。
  7. y 軸の値を指定します:チャートウィザードで、Value ボックスの横にあるボタンをクリックします。Expression Editor で、TotalDue をダブルクリックして、式を$F{TotalDue} に設定します。

  8. シリーズ要素のラベルを指定します:チャートウィザードで、Label ボックスの横にあるボタンをクリックします。Expression Editor で、Name カラムをダブルクリックして、式を$F{Name} に設定します。必要に応じて、以下の式のようにカラムの型を文字列に変換します:
    $F{Name}.toString()
    
  9. チャートを拡大してSummary セクションを埋めます:チャートを右クリックして、Size to Container -> Fit Both をクリックします。

レポートの実行

他のJDBC データソースと同様に、Amazon Athena のデータでレポートを生成できるようになりました。Jaspersoft Studio はレポートの実行ごとにデータを定期的に更新します。

はじめる準備はできましたか?

Amazon Athena Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Amazon Athena Icon Amazon Athena JDBC Driver お問い合わせ

Amazon Athena 連携のパワフルなJava アプリケーションを素早く作成して配布。