Squirrel SQL Client からAzure Data Lake Storage のデータに連携

古川えりか
古川えりか
コンテンツスペシャリスト
Azure Data Lake Storage に接続し、Squirrel SQL Client でクエリを実行します。

CData JDBC Driver for ADLS を使用して、Squirrel SQL Client などのツールでAzure Data Lake Storage へのクエリを実行できます。この記事では、JDBC data source for ADLS を作成し、クエリを実行します。

JDBC Driver for ADLS を追加する

以下のステップに従ってドライバーJAR を追加します。

  1. Squirrel SQL で[Windows]->[View Drivers]と進みます。
  2. プラスアイコンをクリックし、[Add Driver]ウィザードを開きます。
  3. [Name]ボックスで、CData JDBC Driver for ADLS のようなドライバーのわかりやすい名前を入力します。
  4. [Example URL]ボックスで、jdbc:adls: と入力します。
  5. [Extra Class Path]タブで[Add]をクリックします。
  6. 表示される[file explorer]ダイアログで、インストールディレクトリのlib サブフォルダにあるドライバーのJAR ファイルを選択します。
  7. [List Drivers]をクリックして[Class Name]メニューにドライバーのクラス名(cdata.jdbc.adls.ADLSDriver) を入力します。
The definition for the JDBC data source.(Salesforce is shown.)

接続プロパティを定義する

以下のステップに従って、接続プロパティをドライバーエイリアスに保存します。

  1. [Windows]->[View Aliases]と進みます。
  2. エイリアスが一覧表示されているペインで、プラスアイコンをクリックします。
  3. 表示される[Add Alias]ウィザードで、JDBC ドライバーには以下のフィールドが要求されます。

    • Name:CData Azure Data Lake Storage Source のようなエイリアスの名前を入力します。
    • Driver:CData JDBC Driver for ADLS を選択します。
    • URL:jdbc:adls: と入力します。
    The alias definition, containing the connection parameters.(Salesforce is shown.)
  4. 追加のプロパティを定義する場合は、[Properties]をクリックします。
  5. 表示されるダイアログの[Driver properties]タブで、[Use driver properties]のチェックボックスを選択します。
  6. [Specify]カラムで必要な接続プロパティのチェックボックスを選択します。

    Azure Data Lake Storage 接続プロパティの取得・設定方法

    Azure Data Lake Storage Gen2 への接続

    それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。

    • Account:ストレージアカウントの名前
    • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
    • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます

    Azure Data Lake Storage Gen2への認証

    続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。

    アクセスキー

    アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

    Azure ポータルでの手順は以下のとおりです:

    1. ADLS Gen2ストレージアカウントにアクセスします
    2. 設定でアクセスキーを選択します
    3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします

    接続の準備ができたら、以下のプロパティを設定してください。

    • AuthSchemeAccessKey
    • AccessKey:先ほどAzure ポータルで取得したアクセスキーの値

    共有アクセス署名(SAS)

    共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。

    接続の準備ができたら、以下のプロパティを設定してください。

    • AuthSchemeSAS
    • SharedAccessSignature:先ほど生成した共有アクセス署名の値

    その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。

    以下は一般的な接続文字列です。

    jdbc:adls:Schema=ADLSGen2;Account=myAccount;FileSystem=myFileSystem;AccessKey=myAccessKey;
    
    Connection properties automatically detected by Squirrel SQL.(Salesforce is shown.)
  7. [OK]をクリックし、表示されるダイアログで[connect]をクリックして接続を確認します。

スキーマを検出しAzure Data Lake Storage のデータをクエリする

メタデータが読み込まれると、Azure Data Lake Storage のデータソースの新しいタブが表示されます。[Objects]サブタブでは、使用可能なテーブルやビューなどのスキーマ情報を見つけることができます。

Column metadata for a table.(Salesforce is shown.)

テーブルデータを表示するには[Objects]タブでテーブルを選択します。その後、テーブルデータが[Content]タブのグリッドに読み込まれます。

Tables can be edited on the Content tab.(Salesforce is shown.)

SQL クエリを実行するには、[SQL]タブにクエリを入力し、[Run SQL](ランナーアイコン)をクリックします。例:

SELECT FullPath, Permission FROM Resources WHERE Type = 'FILE'
A query and the results.(Salesforce is shown.)

はじめる準備はできましたか?

Azure Data Lake Storage Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Azure Data Lake Storage Icon Azure Data Lake Storage JDBC Driver お問い合わせ

Azure Data Lake Storage データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。