HeidiSQL から Spark のデータに接続
HeidiSQL は、MariaDB、MySQL、SQL Server、PostgreSQL をネイティブにサポートするオープンソースのデータベース管理ツールです。 CData Connect AI と組み合わせると、HeidiSQL からリアルタイムのSpark のデータにもアクセスできるようになります。この記事では、 Connect AI を使用して Spark に接続し、HeidiSQL でSpark のデータをクエリする方法を説明します。
CData Connect AI は、Spark 向けの純粋な SQL Server インターフェースを提供し、ネイティブにサポートされるデータベースにデータをレプリケートすることなく Spark のデータをクエリできます。 最適化されたデータ処理機能を標準搭載しており、CData Connect AI はフィルタや JOIN などのサポート対象の SQL 操作を Spark へ直接送信し、サーバーサイド処理を活用して要求された Spark のデータを迅速に返します。
HeidiSQL 用の Spark 接続を設定
HeidiSQL から Spark への接続は、CData Connect AI を通じて実現できます。HeidiSQL からSpark のデータを操作するには、まず Spark への接続を作成・設定します。
- Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
- 接続を追加パネルから「Spark」を選択
-
Spark に接続するために必要な認証プロパティを入力します。
SparkSQL への接続
SparkSQL への接続を確立するには以下を指定します。
- Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
- Port:SparkSQL インスタンスへの接続用のポートに設定。
- TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
Databricks への接続
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
- Server:Databricks クラスターのサーバーのホスト名に設定。
- Port:443
- TransportMode:HTTP
- HTTPPath:Databricks クラスターのHTTP パスに設定。
- UseSSL:True
- AuthScheme:PLAIN
- User:'token' に設定。
- Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。
- 「Save & Test」をクリック
-
Spark 接続の追加ページで「Permissions」タブに移動し、ユーザーベースの権限を更新します。
パーソナルアクセストークンの追加
REST API、OData API、または仮想 SQL Server を通じて Connect AI に接続する場合、パーソナルアクセストークン(PAT)を使用して Connect AI への接続を認証します。アクセスを細かく管理するため、サービスごとに個別の PAT を作成することをお勧めします。
- Connect AI アプリの右上にある歯車アイコン()をクリックして設定ページを開きます。
- 設定ページで「Access Tokens」セクションに移動し、「 Create PAT」をクリックします。
-
PAT に名前を付けて「Create」をクリックします。
- パーソナルアクセストークンは作成時にのみ表示されるため、必ずコピーして今後の使用に備えて安全に保管してください。
接続が設定され PAT が生成されたので、HeidiSQL からSpark のデータに接続する準備が整いました。
Connect AI を使用して HeidiSQL から Spark に接続
HeidiSQL から CData Connect AI の仮想 SQL Server API への接続を確立するには、以下の手順に従ってください。
新しい HeidiSQL セッションを作成
- Session Manager で、左下の「New」を選択します
- 新しいセッションにわかりやすい名前を付けます(例:Connect-Cloud-Spark)
Connect AI への SQL Server 接続を設定
- セッション設定で、Network type を Microsoft SQL Server (TCP/IP) に設定します
- Library DLL は自動的に MSOLEDBSQL に更新されます
- Hostname/IP を tds.cdata.com に設定します
- User を CData Connect AI のユーザー名に設定します。これは CData Connect AI インターフェースの右上に表示されます。例:test@cdata.com
- Password を前のセクションで Connect AI で作成した PAT に設定します
- Port を 14333 に設定します
HeidiSQL から Spark をクエリ
- 左側のデータベース一覧で、先ほど設定した Spark への接続を見つけます。
- この接続を展開して、Spark 内の個々のテーブルやデータオブジェクトを表示します。
- これらのテーブルに対してカスタム SQL クエリを記述し、データソースを SQL Server データベースのように扱えます。また、関連するテーブルを選択して各表形式データセットを視覚的に探索することもできます
CData Connect AI を入手
SQL Server データベースから 300 以上の SaaS、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスを取得するには、 CData Connect AI を今すぐお試しください!