Elasticsearch のデータを IBM SPSS Modeler にシームレスにインポート

Mohsin Turki
Mohsin Turki
Technical Marketing Engineer
CData ODBC Driver を使用して Elasticsearch のデータを IBM SPSS Modeler に統合し、リアルタイムのインサイトと高度なデータ分析を実現します。

IBM SPSS Modeler は、組織がデータから価値あるインサイトを抽出できる強力なデータマイニング・予測分析プラットフォームです。CData ODBC Driver for Elasticsearch を介してElasticsearch のデータを SPSS Modeler に接続することで、高度なデータマイニング、予測モデリング、統計分析のためのリアルタイムアクセスを活用できます。

このガイドでは、IBM SPSS Modeler をElasticsearch のデータに接続し、シームレスなデータのインポート、準備、分析を行う手順を説明します。CData ODBC Driver for Elasticsearch を使用して、IBM SPSS Modeler でElasticsearch のデータの可能性を最大限に引き出し、実用的なインサイトを得ましょう。

Elasticsearch データ連携について

CData を使用すれば、Elasticsearch のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • SQL エンドポイントと REST エンドポイントの両方にアクセスでき、接続を最適化し、Elasticsearch データの読み書きに関してより多くのオプションを提供します。
  • v2.2 以降およびオープンソース Elasticsearch サブスクリプションを含む、ほぼすべての Elasticsearch インスタンスに接続できます。
  • SCORE() 関数を明示的に要求することなく、常にクエリ結果の関連性スコアを受け取ることができます。これにより、サードパーティツールからのアクセスが簡素化され、クエリ結果のテキスト関連性のランキングを簡単に確認できます。
  • 複数のインデックスを検索でき、クライアントマシンではなく Elasticsearch がクエリと結果の管理・処理を担当します。

ユーザーは、Crystal Reports、Power BI、Excel などの分析ツールと Elasticsearch データを統合し、当社のツールを活用して、Elasticsearch を含むすべてのデータソースへの単一のフェデレートアクセスレイヤーを実現しています。

CData の Elasticsearch ソリューションの詳細については、ナレッジベース記事をご覧ください:CData Elasticsearch Driver Features & Differentiators


はじめに


概要

手順の概要は以下のとおりです:

  1. ODBC ドライバーの設定:CData ODBC Driver for Elasticsearch で必要な接続プロパティを入力し、Elasticsearch のデータ への接続を設定します。
  2. SPSS Modeler での ODBC 接続のセットアップ:IBM SPSS Modeler で、設定済みの DSN を選択して ODBC 接続を確立します。
  3. データのインポートと処理:Elasticsearch のデータ を SPSS Modeler にインポートし、データの確認、フィルタリング、変換、準備を行って、予測分析や統計モデリングに活用します。

CData ODBC Driver を使用した Elasticsearch DSN の設定

まず、CData ODBC Driver を使用してシステムにElasticsearch のデータ用の DSN(データソース名)を設定します。こちらから全機能を備えた 30 日間の無料トライアルをダウンロードしてインストールしてください。

インストールが完了したら、ODBC データソースアドミニストレーターを起動します:

  • Windows の場合:スタートメニューで ODBC データソースアドミニストレーター を検索してアプリケーションを開きます。
  • Mac の場合:アプリケーションからユーティリティを開き、ODBC Manager を選択します。
  • Linux の場合:コマンドラインから ODBC Data Source Administrator を起動するか、インストールされている場合は unixODBC を使用します。

起動したら、CDataElasticsearch のデータSource をダブルクリックし、接続に必要な値を入力します:

Elasticsearch 接続プロパティの取得・設定方法

接続するには、Server およびPort 接続プロパティを設定します。 認証には、User とPassword プロパティ、PKI (public key infrastructure)、またはその両方を設定します。 PKI を使用するには、SSLClientCert、SSLClientCertType、SSLClientCertSubject、およびSSLClientCertPassword プロパティを設定します。

CData 製品は、認証とTLS/SSL 暗号化にX-Pack Security を使用しています。TLS/SSL で接続するには、Server 値に'https://' を接頭します。Note: PKI を 使用するためには、TLS/SSL およびクライアント認証はX-Pack 上で有効化されていなければなりません。

接続されると、X-Pack では、設定したリルムをベースにユーザー認証およびロールの許可が実施されます。

IBM SPSS Modeler での ODBC 接続のセットアップ

DSN の設定が完了したら、IBM SPSS Modeler で接続を行います:

  • IBM SPSS Modeler を起動し、ログインして新しいストリームを作成します。
  • Sources パレットから Database ノードを見つけ、キャンバスにドラッグします。
  • Database ノードをダブルクリックして設定ダイアログを開きます。 を選択し、設定済みの DSN を参照して選択し、OK をクリックします。
  • Database ダイアログで、インポートしたいテーブルを参照して選択し、データをプレビューして、OK をクリックして確定します。

これで IBM SPSS Modeler でElasticsearch のデータを処理・分析する準備が整いました。


データ処理:フィルタ、カテゴリ、モデル

テーブルをインポートしたら、SPSS Modeler でElasticsearch のデータの絞り込み、フィルタリング、カテゴリ分け、モデリングを行えます:

  • フィルタリング:Database 接続をダブルクリックし、Filter セクションでフィールドを選択/解除して、関連するデータに絞り込みます。これにより処理速度とモデル精度が向上します。
  • データ型とロールの設定:Types セクションでフィールドをカテゴリ分けし、各データ型にロールを割り当てます。
  • 基本的な分析の実行:Analysis ノードを Database ノードの隣にドラッグアンドドロップして接続し、Play ボタンをクリックしてストリームを実行しデータを分析します。

これで簡単な分析が完了し、SPSS Modeler がデータベースからのインサイトを処理・表示できるようになりました。


CData で Elasticsearch データの可能性を引き出す

CData ODBC Driver for Elasticsearch を使用すれば、Elasticsearch のデータ を IBM SPSS Modeler にシームレスに接続できます。今すぐ無料トライアルを開始して、リアルタイムデータの可能性を最大限に活用し、高度な分析と意思決定に役立てましょう。

はじめる準備はできましたか?

Elasticsearch ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Elasticsearch Icon Elasticsearch ODBC Driver お問い合わせ

Elasticsearch ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからElasticsearch ドキュメントデータベースへの接続を実現するパワフルなツールです。

RDB にアクセスするときと同感覚でElasticsearch にアクセスし、標準ODBC Driver インターフェースを通じて読み出し、書き込み、更新が可能に。