Google Data Catalog のデータを IBM SPSS Modeler にシームレスにインポート

Mohsin Turki
Mohsin Turki
Technical Marketing Engineer
CData ODBC Driver を使用して Google Data Catalog のデータを IBM SPSS Modeler に統合し、リアルタイムのインサイトと高度なデータ分析を実現します。

IBM SPSS Modeler は、組織がデータから価値あるインサイトを抽出できる強力なデータマイニング・予測分析プラットフォームです。CData ODBC Driver for Google Data Catalog を介してGoogle Data Catalog のデータを SPSS Modeler に接続することで、高度なデータマイニング、予測モデリング、統計分析のためのリアルタイムアクセスを活用できます。

このガイドでは、IBM SPSS Modeler をGoogle Data Catalog のデータに接続し、シームレスなデータのインポート、準備、分析を行う手順を説明します。CData ODBC Driver for Google Data Catalog を使用して、IBM SPSS Modeler でGoogle Data Catalog のデータの可能性を最大限に引き出し、実用的なインサイトを得ましょう。

概要

手順の概要は以下のとおりです:

  1. ODBC ドライバーの設定:CData ODBC Driver for Google Data Catalog で必要な接続プロパティを入力し、Google Data Catalog のデータ への接続を設定します。
  2. SPSS Modeler での ODBC 接続のセットアップ:IBM SPSS Modeler で、設定済みの DSN を選択して ODBC 接続を確立します。
  3. データのインポートと処理:Google Data Catalog のデータ を SPSS Modeler にインポートし、データの確認、フィルタリング、変換、準備を行って、予測分析や統計モデリングに活用します。

CData ODBC Driver を使用した Google Data Catalog DSN の設定

まず、CData ODBC Driver を使用してシステムにGoogle Data Catalog のデータ用の DSN(データソース名)を設定します。こちらから全機能を備えた 30 日間の無料トライアルをダウンロードしてインストールしてください。

インストールが完了したら、ODBC データソースアドミニストレーターを起動します:

  • Windows の場合:スタートメニューで ODBC データソースアドミニストレーター を検索してアプリケーションを開きます。
  • Mac の場合:アプリケーションからユーティリティを開き、ODBC Manager を選択します。
  • Linux の場合:コマンドラインから ODBC Data Source Administrator を起動するか、インストールされている場合は unixODBC を使用します。

起動したら、CDataGoogle Data Catalog のデータSource をダブルクリックし、接続に必要な値を入力します:

Google Data Catalog 接続プロパティの取得・設定方法

認証プロパティを追加する前に、次の接続プロパティを設定してください。

  • OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。 「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
  • ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。

Google Data Catalog への認証

CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。

OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。

IBM SPSS Modeler での ODBC 接続のセットアップ

DSN の設定が完了したら、IBM SPSS Modeler で接続を行います:

  • IBM SPSS Modeler を起動し、ログインして新しいストリームを作成します。
  • Sources パレットから Database ノードを見つけ、キャンバスにドラッグします。
  • Database ノードをダブルクリックして設定ダイアログを開きます。 を選択し、設定済みの DSN を参照して選択し、OK をクリックします。
  • Database ダイアログで、インポートしたいテーブルを参照して選択し、データをプレビューして、OK をクリックして確定します。

これで IBM SPSS Modeler でGoogle Data Catalog のデータを処理・分析する準備が整いました。


データ処理:フィルタ、カテゴリ、モデル

テーブルをインポートしたら、SPSS Modeler でGoogle Data Catalog のデータの絞り込み、フィルタリング、カテゴリ分け、モデリングを行えます:

  • フィルタリング:Database 接続をダブルクリックし、Filter セクションでフィールドを選択/解除して、関連するデータに絞り込みます。これにより処理速度とモデル精度が向上します。
  • データ型とロールの設定:Types セクションでフィールドをカテゴリ分けし、各データ型にロールを割り当てます。
  • 基本的な分析の実行:Analysis ノードを Database ノードの隣にドラッグアンドドロップして接続し、Play ボタンをクリックしてストリームを実行しデータを分析します。

これで簡単な分析が完了し、SPSS Modeler がデータベースからのインサイトを処理・表示できるようになりました。


CData で Google Data Catalog データの可能性を引き出す

CData ODBC Driver for Google Data Catalog を使用すれば、Google Data Catalog のデータ を IBM SPSS Modeler にシームレスに接続できます。今すぐ無料トライアルを開始して、リアルタイムデータの可能性を最大限に活用し、高度な分析と意思決定に役立てましょう。

はじめる準備はできましたか?

Google Data Catalog ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Google Data Catalog Icon Google Data Catalog ODBC Driver お問い合わせ

Google Data Catalog ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからAGoogle Data Catalog にデータ連携。

Google Data Catalog データにデータベースと同感覚でアクセスして、Google Data Catalog データに使い慣れたODBC インターフェースで連携。