Google Cloud Storage のデータを IBM SPSS Modeler にシームレスにインポート

Mohsin Turki
Mohsin Turki
Technical Marketing Engineer
CData ODBC Driver を使用して Google Cloud Storage のデータを IBM SPSS Modeler に統合し、リアルタイムのインサイトと高度なデータ分析を実現します。

IBM SPSS Modeler は、組織がデータから価値あるインサイトを抽出できる強力なデータマイニング・予測分析プラットフォームです。CData ODBC Driver for Google Cloud Storage を介してGoogle Cloud Storage のデータを SPSS Modeler に接続することで、高度なデータマイニング、予測モデリング、統計分析のためのリアルタイムアクセスを活用できます。

このガイドでは、IBM SPSS Modeler をGoogle Cloud Storage のデータに接続し、シームレスなデータのインポート、準備、分析を行う手順を説明します。CData ODBC Driver for Google Cloud Storage を使用して、IBM SPSS Modeler でGoogle Cloud Storage のデータの可能性を最大限に引き出し、実用的なインサイトを得ましょう。

概要

手順の概要は以下のとおりです:

  1. ODBC ドライバーの設定:CData ODBC Driver for Google Cloud Storage で必要な接続プロパティを入力し、Google Cloud Storage のデータ への接続を設定します。
  2. SPSS Modeler での ODBC 接続のセットアップ:IBM SPSS Modeler で、設定済みの DSN を選択して ODBC 接続を確立します。
  3. データのインポートと処理:Google Cloud Storage のデータ を SPSS Modeler にインポートし、データの確認、フィルタリング、変換、準備を行って、予測分析や統計モデリングに活用します。

CData ODBC Driver を使用した Google Cloud Storage DSN の設定

まず、CData ODBC Driver を使用してシステムにGoogle Cloud Storage のデータ用の DSN(データソース名)を設定します。こちらから全機能を備えた 30 日間の無料トライアルをダウンロードしてインストールしてください。

インストールが完了したら、ODBC データソースアドミニストレーターを起動します:

  • Windows の場合:スタートメニューで ODBC データソースアドミニストレーター を検索してアプリケーションを開きます。
  • Mac の場合:アプリケーションからユーティリティを開き、ODBC Manager を選択します。
  • Linux の場合:コマンドラインから ODBC Data Source Administrator を起動するか、インストールされている場合は unixODBC を使用します。

起動したら、CDataGoogle Cloud Storage のデータSource をダブルクリックし、接続に必要な値を入力します:

ユーザーアカウントでの認証

ユーザー資格情報の接続プロパティを設定することなく接続できます。InitiateOAuth をGETANDREFRESH に設定したら、接続の準備が完了です。

接続すると、Google Cloud Storage OAuth エンドポイントがデフォルトブラウザで開きます。ログインして権限を付与すると、OAuth プロセスが完了します。

サービスアカウントでの認証

サービスアカウントには、ブラウザでユーザー認証を行わないサイレント認証があります。サービスアカウントを使用して、企業全体のアクセススコープを委任することもできます。

このフローでは、OAuth アプリケーションを作成する必要があります。詳しくは、ヘルプドキュメントを参照してください。以下の接続プロパティを設定したら、接続の準備が完了です:

  • InitiateOAuth: GETANDREFRESH に設定。
  • OAuthJWTCertType: PFXFILE に設定。
  • OAuthJWTCert: 生成した.p12 ファイルへのパスに設定。
  • OAuthJWTCertPassword: .p12 ファイルのパスワードに設定。
  • OAuthJWTCertSubject: 証明書ストアの最初の証明書が選ばれるように"*" に設定。
  • OAuthJWTIssuer: 「サービスアカウント」セクションで「サービスアカウントの管理」をクリックし、このフィールドをサービスアカウントID フィールドに表示されているE メールアドレスに設定。
  • OAuthJWTSubject: サブジェクトタイプが"enterprise" に設定されている場合はエンタープライズID に設定し、"user" に設定されている場合はアプリユーザーID に設定。
  • ProjectId: 接続するプロジェクトのID に設定。

これで、サービスアカウントのOAuth フローが完了します。

IBM SPSS Modeler での ODBC 接続のセットアップ

DSN の設定が完了したら、IBM SPSS Modeler で接続を行います:

  • IBM SPSS Modeler を起動し、ログインして新しいストリームを作成します。
  • Sources パレットから Database ノードを見つけ、キャンバスにドラッグします。
  • Database ノードをダブルクリックして設定ダイアログを開きます。 を選択し、設定済みの DSN を参照して選択し、OK をクリックします。
  • Database ダイアログで、インポートしたいテーブルを参照して選択し、データをプレビューして、OK をクリックして確定します。

これで IBM SPSS Modeler でGoogle Cloud Storage のデータを処理・分析する準備が整いました。


データ処理:フィルタ、カテゴリ、モデル

テーブルをインポートしたら、SPSS Modeler でGoogle Cloud Storage のデータの絞り込み、フィルタリング、カテゴリ分け、モデリングを行えます:

  • フィルタリング:Database 接続をダブルクリックし、Filter セクションでフィールドを選択/解除して、関連するデータに絞り込みます。これにより処理速度とモデル精度が向上します。
  • データ型とロールの設定:Types セクションでフィールドをカテゴリ分けし、各データ型にロールを割り当てます。
  • 基本的な分析の実行:Analysis ノードを Database ノードの隣にドラッグアンドドロップして接続し、Play ボタンをクリックしてストリームを実行しデータを分析します。

これで簡単な分析が完了し、SPSS Modeler がデータベースからのインサイトを処理・表示できるようになりました。


CData で Google Cloud Storage データの可能性を引き出す

CData ODBC Driver for Google Cloud Storage を使用すれば、Google Cloud Storage のデータ を IBM SPSS Modeler にシームレスに接続できます。今すぐ無料トライアルを開始して、リアルタイムデータの可能性を最大限に活用し、高度な分析と意思決定に役立てましょう。

はじめる準備はできましたか?

Google Cloud Storage ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Google Cloud Storage Icon Google Cloud Storage ODBC Driver お問い合わせ

Google Cloud Storage ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからGoogle Cloud Storage にデータ連携。

Google Cloud Storage データにデータベースと同感覚でアクセス。