Hive のデータのPostgreSQL インターフェースを作成

加藤龍彦
デジタルマーケティング

Hive JDBC Driver のリモート機能を使用し、データアクセス用のPostgreSQL エントリポイントを作成します。

PostgreSQL には多くの対応クライアントがあります。標準のドライバーからBI、アナリティクスツールまで、PostgreSQL はデータ接続の人気のインターフェースです。JDBC ドライバーを使用することで、簡単に任意の標準クライアントから接続できるPostgreSQL エントリポイントを作成できます。

Hive にPostgreSQL データベースとしてアクセスするには、CData JDBC Driver for ApacheHive とJDBC foreign data wrapper (FDW) を使用します。この記事ではFDW をコンパイルしてインストールし、PostgreSQL サーバーからHive にクエリを実行します。

JDBC データソースとしてHive のデータに接続する

JDBC データソースとしてHive に接続するには、以下が必要です。

Driver のJAR パス：JAR ファイルは、インストールディレクトリのlib サブフォルダにあります。
Driver クラス
```
cdata.jdbc.apachehive.ApacheHiveDriver
```
JDBC URL: URL は、"jdbc:apachehive:" で始まり、セミコロンで区切られた名前と値の組み合わせで任意の接続プロパティを含めることができます。
Apache Hive への接続を確立するには以下を指定します。
- Server：HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
- Port：HiveServer2 インスタンスへの接続用のポートに設定。
- TransportMode：Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme：使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
- CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します
ビルトイン接続文字列デザイナ

JDBC URL の構成については、Hive JDBC Driver に組み込まれている接続文字列デザイナを使用できます。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
```
java -jar cdata.jdbc.apachehive.jar
```
接続プロパティを入力し、接続文字列をクリップボードにコピーします。

以下は一般的なJDBC URL です。
```
jdbc:apachehive:Server=127.0.0.1;Port=10000;TransportMode=BINARY;
```

JDBC FDW を構築する

FDW は、PostgreSQL を再コンパイルせずに、PostgreSQL の拡張機能としてインストールできます。例としてjdbc2_fdw 拡張子を使用します。

ご使用のバージョンのJRE 共有オブジェクトから、/usr/lib/libjvm.so にシンボリックリンクを追加します。コマンド例：
```
ln -s /usr/lib/jvm/java-6-openjdk/jre/lib/amd64/server/libjvm.so /usr/lib/libjvm.so
```
ビルドするには、以下のコマンドを実行してください。
```
make install USE_PGXS=1
```

Hive のデータをPostgreSQL データベースとしてクエリする

拡張機能をインストールした後、以下のステップに従ってHive へのクエリの実行を開始します。

データベースにログイン
データベースの拡張機能をロード
```
CREATE EXTENSION jdbc2_fdw;
```

Hive のオブジェクトを作成

CREATE SERVER ApacheHive
FOREIGN DATA WRAPPER jdbc2_fdw OPTIONS (
drivername 'cdata.jdbc.apachehive.ApacheHiveDriver',
url 'jdbc:apachehive:Server=127.0.0.1;Port=10000;TransportMode=BINARY;',
querytimeout '15',
jarfile '/home/MyUser/CData/CData\ JDBC\ Driver\ for\ Salesforce MyDriverEdition/lib/cdata.jdbc.apachehive.jar');

PostgreSQL デーモンに認識されているユーザーのユーザー名とパスワードのユーザーマッピングを作成
```
CREATE USER MAPPING for postgres SERVER ApacheHive OPTIONS (
username 'admin',
password 'test');
```

ローカルデータベースに外部テーブルを作成

postgres=# CREATE FOREIGN TABLE customers (
customers_id text,
customers_City text,
customers_CompanyName numeric)
SERVER ApacheHive OPTIONS (
table_name 'customers');

Hive に対して読み取り/書き込みコマンドを実行可能にする

postgres=# SELECT * FROM customers;

おわりに

このようにCData JDBC Driver for ApacheHive を使って簡単にHive のデータを取得して検索対象にすることができました。ぜひ、30日の無償評価版をお試しください。

はじめる準備はできましたか？

Apache Hive Driver の無料トライアルをダウンロードしてお試しください：

ダウンロード

詳細：

Apache Hive JDBC Driver お問い合わせ

Apache Hive 互換ディストリビューション連携のパワフルなJava アプリケーションを素早く作成して配布。

Hive のデータのPostgreSQL インターフェースを作成

JDBC データソースとしてHive のデータに接続する

ビルトイン接続文字列デザイナ

JDBC FDW を構築する

Hive のデータをPostgreSQL データベースとしてクエリする

おわりに

はじめる準備はできましたか？

この記事の内容

関連記事

Hive のデータ のPostgreSQL インターフェースを作成

JDBC データソースとしてHive のデータに接続する

ビルトイン接続文字列デザイナ

JDBC FDW を構築する

Hive のデータをPostgreSQL データベースとしてクエリする

おわりに

はじめる準備はできましたか？

この記事の内容

関連記事

Hive のデータのPostgreSQL インターフェースを作成