Apache Hive ADO.NET Provider
カスタム .NET アプリケーションおよび SSAS 向けに、ADO.NET を通じて Hive に SQL ベースでアクセスできます。
無料トライアルをダウンロード 今すぐ購入Hive ADO.NET Data Provider を使用すると、.NET アプリケーションから Hive data に簡単に接続できます。 Apache Hive 互換ディストリビューション連携のパワフルな.NET アプリケーションを素早く作成して配布。
Hive .NET Connectivity Features
- SQL を HiveQL にマッピングし、Apache Hive への直接的な標準 SQL-92 アクセスを実現
- Apache Hive NoSQL データで SQL-92 機能を有効化。
- 柔軟な NoSQL フラット化 - 自動スキーマ生成、柔軟なクエリなど。
- Apache Hive ODBC Driver でライブの Apache Hive データに接続し、リアルタイムにデータアクセス
- SQL クエリでのデータ集計と複雑な JOIN を完全サポート
- TLS 1.2、SHA-256、ECC などの最新暗号化技術による安全な接続。
- Hive Connector を介して、主要な BI、レポーティング、ETL ツールやカスタムアプリケーションとシームレスに統合。
対象サービス、API
当ドライバは Apache Hive に接続します。Hadoop 上のデータウェアハウス。
スキーマ、データモデル
Hive データベースおよびテーブルをモデル化します。パーティション化およびバケット化されたテーブルをサポートします。
主要オブジェクト
データベース、テーブル、パーティション、ビュー。Hive メタストアアクセス。
操作
SQL インターフェースを通じた HiveQL クエリ。読み取りおよび書き込み操作。UDF サポート。
認証
Kerberos、LDAP、または認証なし。HiveServer2 接続。
Hive ADO.NET Provider でできること
SQL Server Analysis Service (SSAS) の多次元キューブから Hive を使用できます。分析データモデリングを維持しながら、クラウドおよびオンプレミスを含むあらゆるソースにアクセスできます。
Hive ADO.NET Provider により、開発者は使い慣れた SQL と Entity Framework を使用して Hive に接続するアプリケーションを構築できます。ミッションクリティカルなアプリケーションに Hive を統合したり、簡単なサイドバイサイドアプリケーションを作成したりできます。
.NET ベースのレポーティングおよび分析ツールから Hive に接続できます:
Hive への標準 ADO.NET アクセス
Apache Hive ADO.NET Provider は、任意の .NET アプリケーションから Hive データにアクセスする 最も自然な方法を提供します。従来のデータベースにアクセスするのと同じように、Apache Hive Data Provider オブジェクトを使用して 接続とデータアクセスを行います。Visual Studio サーバーエクスプローラー、使い慣れたクラスを通じたコード、 DataGridView、GridView、DataSet などのデータコントロールで Apache Hive Data Provider を使用できます。
CData ADO.NET Provider for Apache Hive は、データアクセスの複雑さを隠蔽し、強力なセキュリティ機能、 スマートキャッシュ、バッチ処理、ソケット管理などを提供します。
DataAdapter、DataSet、DataTable などの使用
Apache Hive Data Provider は、SQL Server や OLEDB 用のネイティブ .NET データプロバイダーと同じ ADO.NET アーキテクチャを持ち、 HiveConnection、HiveCommand、HiveDataAdapter、HiveDataReader、 HiveDataSource、HiveParameter などを含みます。 これにより、使い慣れた簡単な方法で Hive データにアクセスできるようになりました。
例:
using (HiveConnection conn = new HiveConnection("...")) {
string select = "SELECT * FROM HiveData";
HiveCommand cmd = new HiveCommand(select, conn);
HiveDataAdapter adapter = new HiveDataAdapter(cmd);
using (adapter) {
DataTable table = new DataTable();
adapter.Fill(table);
...
}
}
読み取り専用ではない:完全な更新/CRUD サポート
Apache Hive Data Provider は読み取り専用機能を超えて、作成、読み取り、更新、削除(CRUD)操作を 完全にサポートします。エンドユーザーは、データベーステーブルを操作するのと同じくらい簡単に、 Apache Hive Data Provider が提供するデータを操作できます。
using (HiveConnection connection = new HiveConnection(connectionString)) {
HiveDataAdapter dataAdapter = new HiveDataAdapter(
"SELECT Id, Where FROM HiveData", connection);
dataAdapter.UpdateCommand = new HiveCommand(
"UPDATE HiveData SET Where = @Where " +
"WHERE Id = @ID", connection);
dataAdapter.UpdateCommand.Parameters.AddWithValue("@Where", "Where");
dataAdapter.UpdateCommand.Parameters.AddWithValue("@Id", "80000173-1387137645");
DataTable HiveDataTable = new DataTable();
dataAdapter.Fill(HiveDataTable);
DataRow firstrow = HiveDataTable.Rows[0];
firstrow["Where"] = "New Location";
dataAdapter.Update(HiveDataTable);
}
ADO.NET Provider パフォーマンス
従来のリモートアクセス方式では、パフォーマンスのボトルネックがアプリケーションに致命的な影響を与える可能性があります。 社内利用、商用プロジェクト、Web アプリケーション、モバイルアプリケーションなど、用途に関係なく、 パフォーマンスの低下はプロジェクトの失敗につながりかねません。リモートソースからのデータアクセスには、 これらの問題を引き起こす可能性があります。一般的な問題には以下が含まれます:
- ネットワーク接続 - 遅いネットワーク接続とレイテンシの問題は、モバイルアプリケーションでよく見られます。
- サービス遅延 - サーバーのハードウェアまたはソフトウェアの更新によるサービス中断が原因で発生する遅延。
- 大量データ - 意図的または意図しない大量データのリクエスト。
- 切断 - ネットワーク接続の完全な喪失。
CData ADO.NET Provider for Apache Hive は、パフォーマンスを大幅に向上させ、アプリケーションのボトルネックを劇的に削減できる 強力なスマートキャッシュ技術をサポートすることで、これらの問題を解決します。
スマートキャッシュ
スマートキャッシュは、クエリされたデータをローカルデータベースに保存することで機能する設定可能なオプションです。 スマートキャッシュを有効にすると、リモートソースから取得したデータのレプリカを含む永続的なローカルキャッシュデータベースが作成されます。 キャッシュデータベースは小さく、軽量で、非常に高速であり、永続ストレージとして複数の接続で共有できます。
CData の ADO.NET Provider でのキャッシュは高度に設定可能で、以下のオプションがあります:
- 自動キャッシュ - すべてのリクエストでデータの自動ローカルキャッシュを維持します。プロバイダーは SELECT クエリを実行するたびに自動的にキャッシュデータベースにデータをロードします。クエリによって返された各行は、 キャッシュデータベース内の対応するテーブルに必要に応じて挿入または更新されます。
- 明示的キャッシュ - オンデマンドでのみキャッシュします。開発者は、キャッシュに保存するデータと 更新のタイミングを正確に決定します。明示的キャッシュは、CACHE ステートメントの明示的な実行を使用して、 キャッシュ内容を完全に制御できます。
- キャッシュなし - すべてのリクエストはライブデータのみにアクセスし、ローカルキャッシュファイルは作成されません。
この強力なキャッシュ機能により、アプリケーションのパフォーマンスが向上し、追加のローカルストレージや データのシリアル化/デシリアル化のコードを書くことなく、切断後も限定的な機能を継続できます。
ADO.NET Provider のキャッシュとキャッシュのベストプラクティスの詳細については、 付属のヘルプファイルをご覧ください。
Visual Studio 統合 & サーバーエクスプローラー
新しい Apache Hive ADO.NET Provider の操作は簡単です。フルマネージド .NET Data Provider として、Apache Hive Data Provider は Visual Studio 開発環境および任意の .NET アプリケーションとシームレスに統合します。
ADO.NET Data Provider として、Apache Hive ADO.NET Provider を使用して Visual Studio サーバーエクスプローラーから 直接 Apache Hive データにアクセスし、探索できます。
簡単です。標準の ADO.NET アダプターとして、開発者は標準のデータベースに接続するのと同じように サーバーエクスプローラーを Apache Hive ADO.NET Provider に接続できます。
利用可能なすべてのデータを探索!Apache Hive ADO.NET Provider により、Visual Studio からライブの Apache Hive データに簡単にアクセスできます。
開発者統合:Hive へのデータバインド
Web、デスクトップ、モバイル .NET アプリケーションと Apache Hive の接続は、SQL Server を操作するのと同じです。 コードを書かずに Apache Hive ADO.NET Provider をアプリケーションに統合することも可能です。
開発者は、好みの方法で Apache Hive ADO.NET Provider にアクセスできます。Visual Studio の Winforms または Webforms デザイナーを通じて視覚的に、またはコードから直接アクセスできます。
- オブジェクトのスマートタグを設定することで、Apache Hive データソースをフォームコンポーネントに直接接続できます。
- サーバーエクスプローラーから新しいデータ接続を追加し、Apache Hive データソースを選択します。次に、
オブジェクトに接続するフィード、ビュー、またはサービスを選択します。
完了!SQL Server に接続するのと同じです。