Redshift のデータをTableau Desktop に接続して可視化やダッシュボード構築に活用する方法
Tableau といえば、直感的に使えるUI と高度なデータ分析・ダッシュボード構築機能を備えた人気のBI ツールですね。このTableau をCData ODBC Driver for Redshift と組み合わせることで、Tableau からリアルタイムでRedshift のデータにアクセスできます。本記事では、CData ODBC ドライバのインストールからTableau Desktop でのRedshift のデータへの連携、ダッシュボードの構築までをステップバイステップでご紹介します。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持った製品です。
- Redshift をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレデータソースに対応
- Tableau をはじめとする多様なBI・帳票・データ分析ツールにRedshift のデータを連携
- ノーコードでの手軽な接続設定
CData ODBC ドライバでは、1.データソースとしてRedshift の接続を設定、2.Tableau 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
Redshift のODBC 接続を構成する
まずは、本記事右側のサイドバーからRedshift ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
インストール後自動で開かれるMicrosoft ODBC データソースアドミニストレーターを使って、ODBC DSN を作成および設定できます。
Amazon Redshift への接続
それでは、早速Amazon Redshift に接続していきましょう。データに接続するには、以下の接続パラメータを指定します。
- Server:Amazon Redshift データベースをホスティングしているサーバーのホスト名またはIP アドレス
- Database:Amazon Redshift クラスター用に作成したデータベース
- Port(オプション):Amazon Redshift データベースをホスティングしているサーバーのポート。デフォルトは5439です
これらの値は、以下のステップでAWS マネージメントコンソールから取得できます。
- Amazon Redshift コンソールを開きます(http://console.aws.amazon.com/redshift)
- Clusters ページで、クラスター名をクリックしてください
- Configuration タブの"Cluster Database Properties" セクションからプロパティを取得します。接続プロパティの値は、ODBC URL で設定された値と同じになります
Amazon Redshiftへの認証
CData 製品では幅広い認証オプションに対応しています。標準認証情報からIAM クレデンシャル、ADFS、Ping Federate、Microsoft Entra ID(Azure AD)、Azure AD PKCE まで利用可能です。標準認証
ログイン資格情報を使用してAmazon Redshift に接続するには、以下のプロパティを設定してみましょう。- AuthScheme:Basic
- User:認証するユーザーのログイン情報
- Password:認証するユーザーのパスワード
その他の認証方法については、ヘルプドキュメントをご確認ください。
Tableau Desktop にODBC 接続を追加する
次に、Tableau Dekstop を開いて先ほど設定したRedshift へのODBC 接続を、データソースとして追加しましょう。まずは、Tableau Desktop を起動します。
- 起動後最初に表示される画面で、「接続」パネルから、「その他」→「その他データベース(ODBC)」をクリックします。
- 表示される画面の「DSN」に、先ほど設定したCData Redshift Source を指定して、「接続」をクリックします。完了したら、「サインイン」ボタンをクリックします。
Redshift のデータへの接続はこれだけで完了です!ここからは実際にRedshift のデータを取得して、データを使ったダッシュボードを作っていきましょう。
Tableau でRedshift のデータを可視化する
可視化・分析に使用するRedshift のデータを選択する
まずはRedshift から可視化 / 分析に使うデータを指定します。
- 「データ ソース」の画面が表示されたら、「データベース」ドロップダウンで「CData」を選択します。
- 次に、「スキーマ」ボックスで「🔎」(検索)マークをクリックして、「Redshift」を選択します。
- 次に「テーブル」ボックスで、Redshift 内の可視化したいテーブル名を検索して選択します。または、「🔎」(検索)マークをクリックしてテーブルを一覧を表示してそこから選択したり、「新しいカスタム SQL」ボタンからSQL ベースでデータをクエリすることもできます。
- テーブルを選択すると右側の画面に選択したテーブルが表示されるので、必要に応じてテーブル間の関連付けを行います。画面下部のペインで選択したテーブルのフィールドやプレビューを参照できます。
- 右上の「接続」メニューで「ライブ」オプションをクリックすると、Tableau へのデータロードをスキップしてリアルタイムでデータを扱うことができます。
これで、可視化に使用するデータの準備が整いました。あとは、Tableau の強力な可視化機能をフル活用してデータを可視化 / 分析できます。
Redshift のデータを可視化する
それでは、実際にRedshift のデータを可視化してみましょう。ここでは例としてOrders テーブルのデータを使います。
- データソースからシートタブに移動して、「テーブル」以下に表示されているカラムから可視化したいカラムを選択して行と列にドラッグドロップします。Tableau が自動で適切なグラフを選択くれるので、これだけでデータを可視化できました。
- 複数のワークシートを作成すれば、組み合わせてダッシュボードを構築することもできます。
Redshift からTableau へのデータ連携には、ぜひCData ODBC ドライバをご利用ください
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをTableau からコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
日本のユーザー向けにCData ODBC ドライバは、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。