DBArtisan で HDFS のデータ を JDBC データソースとして管理
CData JDBC Driver for HDFS を使えば、HDFS のデータ をデータベースとしてアクセスできるようになり、DBArtisan などのデータベース管理ツールとシームレスに連携できます。この記事では、DBArtisan で HDFS の JDBC データソースを作成する方法を説明します。一度接続すれば、データを視覚的に編集したり、標準 SQL を実行したりすることができます。
HDFS のデータ を DBArtisan プロジェクトに統合
以下のステップに従って、プロジェクトに HDFS のデータ をデータベースインスタンスとして登録します。
- DBArtisan で、Data Source -> Register Datasource をクリックします。
- Generic JDBC を選択します。
- Manage をクリックします。
- 表示されたダイアログで、New をクリックします。ドライバーの名前を入力し、Add をクリックします。次に表示されるダイアログで、ドライバー JAR ファイルを指定します。ドライバー JAR はインストールディレクトリの lib サブフォルダ内にあります。
-
Connection URL ボックスに、資格情報やその他の必要な接続プロパティを JDBC URL 形式で入力します。
HDFS 接続プロパティの取得・設定方法
HDFS への認証には、次の接続プロパティを設定します。
- Host:HDFS インスタンスのホストに設定。
- Port:HDFS インスタンスのポートに設定。デフォルトのポートは"9870" です。
組み込みの接続文字列デザイナー
JDBC URL の構成には、HDFS JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。
java -jar cdata.jdbc.hdfs.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
一般的な接続文字列は以下のとおりです。
jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;
- ウィザードを完了して、HDFS のデータ に接続します。HDFS エンティティが Datasource Explorer に表示されます。
これで、他のデータベースと同じように HDFS のデータ を操作できます。 HDFS API でサポートされるクエリの詳細については、ドライバーのヘルプドキュメントを参照してください。