Presto のデータ の PostgreSQL インターフェースを作成(MySQL リモーティング経由の JDBC)
PostgreSQL には多くの対応クライアントがあります。標準のドライバーから BI、アナリティクスツールまで、PostgreSQL はデータ接続の人気のインターフェースです。JDBC ドライバーのリモーティング機能を使用することで、任意の標準クライアントから接続できる PostgreSQL エントリポイントを簡単に作成できます。
Presto のデータ に PostgreSQL データベースとしてアクセスするには、CData JDBC Driver for Presto のリモーティング機能と、EnterpriseDB の MySQL Foreign Data Wrapper(FDW)を使用します。この記事では、FDW をインストールし、PostgreSQL Server からPresto のデータにクエリを実行する方法を説明します。
Presto データ連携について
CData を使用すれば、Trino および Presto SQL エンジンのライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Trino v345 以降(旧 PrestoSQL)および Presto v0.242 以降(旧 PrestoDB)のデータにアクセスできます。
- Trino または Presto インスタンスの基盤となるすべてのデータに対して読み取り・書き込みアクセスができます。
- 最大スループットのための最適化されたクエリ生成。
Presto と Trino により、ユーザーは単一のエンドポイントを通じてさまざまな基盤データソースにアクセスできます。CData の接続と組み合わせることで、ユーザーはインスタンスへの純粋な SQL-92 アクセスを取得し、ビジネスデータをデータウェアハウスに統合したり、Power BI や Tableau などのお気に入りのツールからライブデータに直接簡単にアクセスしたりできます。
多くの場合、CData のライブ接続は、ツールで利用可能なネイティブのインポート機能を上回ります。あるお客様は、レポートに必要なデータセットのサイズが大きいため、Power BI を効果的に使用できませんでした。同社が CData Power BI Connector for Presto を導入したところ、DirectQuery 接続モードを使用してリアルタイムでレポートを生成できるようになりました。
はじめに
Presto への接続を設定
以下の手順に従って、Presto への接続に必要な認証情報やその他の接続プロパティをドライバーの MySQL デーモンに設定します。MySQL デーモンは、Presto のデータ を CDataPresto という名前の MySQL データベースとして公開します。デーモンの設定ファイル内の databases セクションに接続プロパティを追加します。設定ファイルは、ドライバーのインストールディレクトリの lib サブフォルダにあります。
以下は一般的な接続文字列です:
[databases] presto = "Server=127.0.0.1;Port=8080;"
また、users セクションにユーザーを作成します。
MySQL デーモンのすべての設定オプションについては、ヘルプドキュメントをご参照ください。
リモーティングサービスを開始
以下の手順に従って、CData JDBC Driver for Presto の MySQL リモーティング機能を有効にします。
ドライバーはテスト用に適したデフォルト設定を作成します。サービスを開始するだけでPresto のデータに接続できます。
- 以下のコマンドで MySQL リモーティングサービスを開始します:
java -jar cdata.jdbc.presto.jar -f cdata.jdbc.presto.remoting.ini
MySQL Foreign Data Wrapper をビルドしてインストール
Foreign Data Wrapper は、PostgreSQL を再コンパイルせずに、PostgreSQL の拡張機能としてインストールできます。
お使いの OS で pgxn が利用可能な場合は、以下のコマンドでインストールできます:
pgxn install mysql_fdw USE_PGXS=1
利用できない場合は、以下の手順で自分でビルドしてください:
- MySQL C クライアントライブラリをインストールし、EnterpriseDB の MySQL 用 FDW のソースを取得します(例:GitHub から)。
- FDW をビルドします。pg_config と mysql_config の実行ファイルを PATH に追加してください:
env PATH=/usr/local/pgsql/bin:/usr/local/mysql/bin:$PATH make USE_PGXS=1
-
FDW をインストールします:
make USE_PGXS=1 install
インストールを完了するには、libmysqlclient ライブラリを環境にロードする必要があります(例:パスに追加するなど)。
Presto のデータ を PostgreSQL データベースとしてクエリ
拡張機能をインストールした後、以下の手順に従ってPresto のデータへのクエリ実行を開始します:
- データベースにログインします。
-
データベースの拡張機能をロードします:
postgres=#CREATE EXTENSION mysql_fdw;
-
Presto のデータ 用のサーバーオブジェクトを作成します:
postgres=# CREATE SERVER Presto FOREIGN DATA WRAPPER mysql_fdw OPTIONS (host '127.0.0.1', port '3309');
-
MySQL デーモンに認識されているユーザーのユーザー名とパスワードでユーザーマッピングを作成します:
postgres=# CREATE USER MAPPING for postgres SERVER Presto OPTIONS (username 'admin', password 'test');
-
ローカルスキーマを作成します:
postgres=# CREATE SCHEMA Presto_db;
-
デーモン設定ファイルで定義した Presto データベース内のすべてのテーブルをインポートします:
postgres=# IMPORT FOREIGN SCHEMA "Presto" FROM SERVER Presto INTO Presto_db;
これで Presto に対して 読み取り/書き込み コマンドを実行できます:
postgres=# SELECT * FROM Presto_db."customer";