Azure Data Lake Storage のデータを IBM SPSS Modeler にシームレスにインポート

Mohsin Turki
Technical Marketing Engineer

CData ODBC Driver を使用して Azure Data Lake Storage のデータを IBM SPSS Modeler に統合し、リアルタイムのインサイトと高度なデータ分析を実現します。

IBM SPSS Modeler は、組織がデータから価値あるインサイトを抽出できる強力なデータマイニング・予測分析プラットフォームです。CData ODBC Driver for Azure Data Lake Storage を介してAzure Data Lake Storage のデータを SPSS Modeler に接続することで、高度なデータマイニング、予測モデリング、統計分析のためのリアルタイムアクセスを活用できます。

このガイドでは、IBM SPSS Modeler をAzure Data Lake Storage のデータに接続し、シームレスなデータのインポート、準備、分析を行う手順を説明します。CData ODBC Driver for Azure Data Lake Storage を使用して、IBM SPSS Modeler でAzure Data Lake Storage のデータの可能性を最大限に引き出し、実用的なインサイトを得ましょう。

概要

手順の概要は以下のとおりです：

ODBC ドライバーの設定：CData ODBC Driver for Azure Data Lake Storage で必要な接続プロパティを入力し、Azure Data Lake Storage のデータへの接続を設定します。
SPSS Modeler での ODBC 接続のセットアップ：IBM SPSS Modeler で、設定済みの DSN を選択して ODBC 接続を確立します。
データのインポートと処理：Azure Data Lake Storage のデータを SPSS Modeler にインポートし、データの確認、フィルタリング、変換、準備を行って、予測分析や統計モデリングに活用します。

CData ODBC Driver を使用した Azure Data Lake Storage DSN の設定

まず、CData ODBC Driver を使用してシステムにAzure Data Lake Storage のデータ用の DSN（データソース名）を設定します。こちらから全機能を備えた 30 日間の無料トライアルをダウンロードしてインストールしてください。

インストールが完了したら、ODBC データソースアドミニストレーターを起動します：

Windows の場合：スタートメニューで ODBC データソースアドミニストレーター を検索してアプリケーションを開きます。
Mac の場合：アプリケーションからユーティリティを開き、ODBC Manager を選択します。
Linux の場合：コマンドラインから ODBC Data Source Administrator を起動するか、インストールされている場合は unixODBC を使用します。

起動したら、CDataAzure Data Lake Storage のデータSource をダブルクリックし、接続に必要な値を入力します：

Azure Data Lake Storage 接続プロパティの取得・設定方法

Azure Data Lake Storage Gen2 への接続

それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。

Account：ストレージアカウントの名前
FileSystem：このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
Directory（オプション）：レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます

Azure Data Lake Storage Gen2への認証

続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています：アクセスキー（AccessKey）の使用、共有アクセス署名（SAS）の使用、Azure Active Directory OAuth（AzureAD）経由、Azure サービスプリンシパル（AzureServicePrincipal またはAzureServicePrincipalCert）経由、およびManaged Service Identity（AzureMSI）経由です。

アクセスキー

アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

Azure ポータルでの手順は以下のとおりです：

ADLS Gen2ストレージアカウントにアクセスします
設定でアクセスキーを選択します
利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします

接続の準備ができたら、以下のプロパティを設定してください。

AuthScheme：AccessKey
AccessKey：先ほどAzure ポータルで取得したアクセスキーの値

共有アクセス署名（SAS）

共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。

接続の準備ができたら、以下のプロパティを設定してください。

AuthScheme：SAS
SharedAccessSignature：先ほど生成した共有アクセス署名の値

その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。

IBM SPSS Modeler での ODBC 接続のセットアップ

DSN の設定が完了したら、IBM SPSS Modeler で接続を行います：

IBM SPSS Modeler を起動し、ログインして新しいストリームを作成します。

Sources パレットから Database ノードを見つけ、キャンバスにドラッグします。

Database ノードをダブルクリックして設定ダイアログを開きます。を選択し、設定済みの DSN を参照して選択し、OK をクリックします。
Database ダイアログで、インポートしたいテーブルを参照して選択し、データをプレビューして、OK をクリックして確定します。

IBM SPSS Modeler データベース接続（Salesforce の例）

これで IBM SPSS Modeler でAzure Data Lake Storage のデータを処理・分析する準備が整いました。

データ処理：フィルタ、カテゴリ、モデル

テーブルをインポートしたら、SPSS Modeler でAzure Data Lake Storage のデータの絞り込み、フィルタリング、カテゴリ分け、モデリングを行えます：

フィルタリング：Database 接続をダブルクリックし、Filter セクションでフィールドを選択/解除して、関連するデータに絞り込みます。これにより処理速度とモデル精度が向上します。

IBM SPSS Modeler データフィルタリング（Salesforce の例）

データ型とロールの設定：Types セクションでフィールドをカテゴリ分けし、各データ型にロールを割り当てます。

IBM SPSS Modeler データ型のカテゴリ分け（Salesforce の例）

基本的な分析の実行：Analysis ノードを Database ノードの隣にドラッグアンドドロップして接続し、Play ボタンをクリックしてストリームを実行しデータを分析します。

これで簡単な分析が完了し、SPSS Modeler がデータベースからのインサイトを処理・表示できるようになりました。

CData で Azure Data Lake Storage データの可能性を引き出す

CData ODBC Driver for Azure Data Lake Storage を使用すれば、Azure Data Lake Storage のデータを IBM SPSS Modeler にシームレスに接続できます。今すぐ無料トライアルを開始して、リアルタイムデータの可能性を最大限に活用し、高度な分析と意思決定に役立てましょう。

はじめる準備はできましたか？

Azure Data Lake Storage ODBC Driver の無料トライアルをダウンロードしてお試しください：

ダウンロード

詳細：

Azure Data Lake Storage ODBC Driver お問い合わせ

Azure Data Lake Storage ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからAzure Data Lake Storage にデータ連携。

Azure Data Lake Storage にデータベースと同感覚でアクセスして、Azure Data Lake Storage データに使い慣れたODBC インターフェースで連携。