HBase Python Connector

Python で HBase の読み取り、書き込み、更新が可能

Python ベースのデータアクセス、可視化、ORM、ETL、AI/ML、カスタムアプリを Apache HBase と簡単に接続!


  無料トライアルをダウンロード   今すぐ購入

その他の テクノロジー


HBase Logo

Apache Hbase へのデータ連携用のPython Connector ライブラリ。 pandas、SQLAlchemy、Dash、petl などの主要なPython ツールにApache Hbase をシームレスに統合。 使いやすい Python Database API(DB-API)モジュールで、HBase データを Python およびあらゆる Python ベースアプリケーションに接続できます。

機能

  • アプリケーション SQL クエリを受け付け、実行プランを生成
  • HBase バージョン 0.98 以降で利用可能な HBase REST Server 0.0.3 に接続
  • ANSI SQL-92 を HBase REST API 呼び出しにマッピング
  • Apache Knox Gateway をサポート
  • Apache HBase ODBC Driver でライブの Apache HBase データに接続し、リアルタイムにデータアクセス
  • SQL クエリでのデータ集計と複雑な JOIN を完全サポート
  • TLS 1.2、SHA-256、ECC などの最新暗号化技術による安全な接続。
  • HBase Connector を介して、主要な BI、レポーティング、ETL ツールやカスタムアプリケーションとシームレスに統合。

仕様

  • HBase 連携用のPython Database API (DB-API) モジュール。
  • 使い慣れたSQL でApache HBase データにアクセス。HBase に使い慣れたPython Database Connectivity でデータ連携。
  • pandas、SQLAlchemy、Dash、petl などの人気のPython ツールにシームレスに統合。
  • 使いやすいフラット化されたインターフェースでApache HBase カラム型データベースにアクセス。
  • データ、パラメータ、メタデータの完全な Unicode サポート。


CData Python Connectors の動作を確認!

CData Python Connectors に搭載された強力なデータ統合機能をビデオでご覧ください。

Python Connector の概要ビデオを見る

Apache HBase との Python 接続

Python を通じて、サポートされるあらゆるデータソースへのフル機能で一貫した SQL アクセス


  • ユニバーサル Python HBase 接続

    一般的な Python ベースのフレームワークから HBase データに簡単に接続できます:


    • データ分析/可視化:Jupyter Notebook、pandas、Matplotlib
    • ORM:SQLAlchemy、SQLObject、Storm
    • Web アプリケーション:Dash、Django
    • ETL:Apache Airflow、Luigi、Bonobo、Bubbles、petl
  • 人気ツールとの統合

    HBase Connector は、Anaconda、Visual Studio Python IDE、PyCharm などの人気のデータサイエンスおよび開発ツールとシームレスに統合できます。

  • レプリケーションとキャッシュ

    レプリケーションおよびキャッシュコマンドにより、Oracle、SQL Server、Google Cloud SQL などのローカルおよびクラウドデータストアへのデータコピーが簡単に行えます。レプリケーションコマンドには、キャッシュデータのインテリジェントな増分更新を可能にする多くの機能が含まれています。

  • 文字列、日付、数値 SQL 関数

    HBase Connector には、列の値を目的の結果に変換できる 50 以上の関数ライブラリが含まれています。一般的な例として、Regex、JSON、XML 処理関数があります。

  • 協調クエリ処理

    Python Connector は、必要に応じて追加のクライアントサイド処理により HBase の機能を強化し、SUM、AVG、MAX、MIN などのデータの分析サマリーを可能にします。

  • 簡単にカスタマイズ・設定可能

    HBase Connector が公開するデータモデルは、新しいビルドを必要とせずに、テーブル/列の追加や削除、データ型の変更などを簡単にカスタマイズできます。これらのカスタマイズは、編集しやすい人間が読めるスキーマファイルを使用して実行時にサポートされます。

  • エンタープライズクラスの安全な接続

    すべてのクライアント・サーバー通信に対する TLS/SSL データ暗号化など、標準的なエンタープライズクラスのセキュリティ機能を搭載しています。

Python で HBase に接続

CData Python Connector は、Database API(DB-API)インターフェースを活用して、幅広い標準的な Python データツールから HBase を簡単に操作できるようにします。Python でのデータへの接続と操作は、データソースに関係なく、基本的なパターンに従います:

  • HBase への接続プロパティを設定
  • HBase にクエリを実行してデータを取得または更新
  • HBase データを Python データツールに接続


Python で HBase に接続する

Python からデータに接続するには、拡張機能をインポートして接続を作成します:

import cdata. as mod
conn = mod.connect("User=user@domain.com; Password=password;")

#Create cursor and iterate over results
cur = conn.cursor()
cur.execute("SELECT * FROM HBaseDB")

rs = cur.fetchall()

for row in rs:
print(row)

拡張機能をインポートすれば、使い慣れた Python モジュールやツールキットを使用して エンタープライズデータを操作でき、ビジネスを推進するアプリを迅速に構築できます。

pandas で HBase データを可視化

HBase Python Connector のデータ中心のインターフェースにより、pandas や SQLAlchemy などの 人気ツールと簡単に統合して、リアルタイムでデータを可視化できます。

engine = create_engine("///Password=password&User=user")

df = pandas.read_sql("SELECT * FROM HBaseDB", engine)

df.plot()
plt.show()

読み取り専用ではない:完全な更新/CRUD サポート

HBase Connector は読み取り専用機能を超えて、作成、読み取り、更新、削除(CRUD)操作を 完全にサポートします。エンドユーザーは、データベーステーブルを操作するのと同じくらい簡単に、 HBase Connector が提供するデータを操作できます。