Elasticsearch のデータを IBM SPSS Modeler にシームレスにインポート
IBM SPSS Modeler は、組織がデータから価値あるインサイトを抽出できる強力なデータマイニング・予測分析プラットフォームです。CData ODBC Driver for Elasticsearch を介してElasticsearch のデータを SPSS Modeler に接続することで、高度なデータマイニング、予測モデリング、統計分析のためのリアルタイムアクセスを活用できます。
このガイドでは、IBM SPSS Modeler をElasticsearch のデータに接続し、シームレスなデータのインポート、準備、分析を行う手順を説明します。CData ODBC Driver for Elasticsearch を使用して、IBM SPSS Modeler でElasticsearch のデータの可能性を最大限に引き出し、実用的なインサイトを得ましょう。
Elasticsearch データ連携について
CData を使用すれば、Elasticsearch のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- SQL エンドポイントと REST エンドポイントの両方にアクセスでき、接続を最適化し、Elasticsearch データの読み書きに関してより多くのオプションを提供します。
- v2.2 以降およびオープンソース Elasticsearch サブスクリプションを含む、ほぼすべての Elasticsearch インスタンスに接続できます。
- SCORE() 関数を明示的に要求することなく、常にクエリ結果の関連性スコアを受け取ることができます。これにより、サードパーティツールからのアクセスが簡素化され、クエリ結果のテキスト関連性のランキングを簡単に確認できます。
- 複数のインデックスを検索でき、クライアントマシンではなく Elasticsearch がクエリと結果の管理・処理を担当します。
ユーザーは、Crystal Reports、Power BI、Excel などの分析ツールと Elasticsearch データを統合し、当社のツールを活用して、Elasticsearch を含むすべてのデータソースへの単一のフェデレートアクセスレイヤーを実現しています。
CData の Elasticsearch ソリューションの詳細については、ナレッジベース記事をご覧ください:CData Elasticsearch Driver Features & Differentiators
はじめに
概要
手順の概要は以下のとおりです:
- ODBC ドライバーの設定:CData ODBC Driver for Elasticsearch で必要な接続プロパティを入力し、Elasticsearch のデータ への接続を設定します。
- SPSS Modeler での ODBC 接続のセットアップ:IBM SPSS Modeler で、設定済みの DSN を選択して ODBC 接続を確立します。
- データのインポートと処理:Elasticsearch のデータ を SPSS Modeler にインポートし、データの確認、フィルタリング、変換、準備を行って、予測分析や統計モデリングに活用します。
CData ODBC Driver を使用した Elasticsearch DSN の設定
まず、CData ODBC Driver を使用してシステムにElasticsearch のデータ用の DSN(データソース名)を設定します。こちらから全機能を備えた 30 日間の無料トライアルをダウンロードしてインストールしてください。
インストールが完了したら、ODBC データソースアドミニストレーターを起動します:
- Windows の場合:スタートメニューで ODBC データソースアドミニストレーター を検索してアプリケーションを開きます。
- Mac の場合:アプリケーションからユーティリティを開き、ODBC Manager を選択します。
- Linux の場合:コマンドラインから ODBC Data Source Administrator を起動するか、インストールされている場合は unixODBC を使用します。
起動したら、CDataElasticsearch のデータSource をダブルクリックし、接続に必要な値を入力します:
Elasticsearch 接続プロパティの取得・設定方法
接続するには、Server およびPort 接続プロパティを設定します。 認証には、User とPassword プロパティ、PKI (public key infrastructure)、またはその両方を設定します。 PKI を使用するには、SSLClientCert、SSLClientCertType、SSLClientCertSubject、およびSSLClientCertPassword プロパティを設定します。
CData 製品は、認証とTLS/SSL 暗号化にX-Pack Security を使用しています。TLS/SSL で接続するには、Server 値に'https://' を接頭します。Note: PKI を 使用するためには、TLS/SSL およびクライアント認証はX-Pack 上で有効化されていなければなりません。
接続されると、X-Pack では、設定したリルムをベースにユーザー認証およびロールの許可が実施されます。
IBM SPSS Modeler での ODBC 接続のセットアップ
DSN の設定が完了したら、IBM SPSS Modeler で接続を行います:
- IBM SPSS Modeler を起動し、ログインして新しいストリームを作成します。
- Sources パレットから Database ノードを見つけ、キャンバスにドラッグします。
- Database ノードをダブルクリックして設定ダイアログを開きます。
を選択し、設定済みの DSN を参照して選択し、OK をクリックします。 - Database ダイアログで、インポートしたいテーブルを参照して選択し、データをプレビューして、OK をクリックして確定します。
これで IBM SPSS Modeler でElasticsearch のデータを処理・分析する準備が整いました。
データ処理:フィルタ、カテゴリ、モデル
テーブルをインポートしたら、SPSS Modeler でElasticsearch のデータの絞り込み、フィルタリング、カテゴリ分け、モデリングを行えます:
- フィルタリング:Database 接続をダブルクリックし、Filter セクションでフィールドを選択/解除して、関連するデータに絞り込みます。これにより処理速度とモデル精度が向上します。
- データ型とロールの設定:Types セクションでフィールドをカテゴリ分けし、各データ型にロールを割り当てます。
- 基本的な分析の実行:Analysis ノードを Database ノードの隣にドラッグアンドドロップして接続し、Play ボタンをクリックしてストリームを実行しデータを分析します。
これで簡単な分析が完了し、SPSS Modeler がデータベースからのインサイトを処理・表示できるようになりました。
CData で Elasticsearch データの可能性を引き出す
CData ODBC Driver for Elasticsearch を使用すれば、Elasticsearch のデータ を IBM SPSS Modeler にシームレスに接続できます。今すぐ無料トライアルを開始して、リアルタイムデータの可能性を最大限に活用し、高度な分析と意思決定に役立てましょう。