エンタープライズサーチのNeuron にMicrosoft Exchange のデータを取り込んで検索利用

杉本和也
リードエンジニア

企業内検索エンジンサービスの Neuron にMicrosoft Exchange のデータを取り込んで検索する方法：CData JDBC Driver。

ブレインズテクノロジー社のNeuron は、先端OSS 技術（Apache Solr）を活用したエンタープライズサーチ（企業内検索エンジン）サービスです。Apache Solr は、エンタープライズサーチ機能をAPI として提供してくれますが、Neuron はApache Solr に企業ユーザーがデータを探索するためのシンプルかつ使いやすいユーザーインターフェースと管理画面・運用機能を提供してくれます。これによりエンドユーザーが簡単にエンタープライズサーチを利用することができます。管理画面では、ファイルやデータのクローリング設定がUI で行えるようになっています。この記事では、Neuron に備わっているJDBC インターフェース経由で、CData JDBC Driver for Exchange を利用することでNeuron にMicrosoft Exchange のデータを取り込んで検索で利用できるようにします。

Neuron にCData JDBC Driver for Exchange データをロード

CData JDBC Driver for Exchange のインストールと.jar ファイルの配置

CData JDBC Driver for Exchange をNeuron と同じマシンにインストールします。
以下のパスにJDBC Driver がインストールされます。
C:\Program Files\CData\CData JDBC Driver for Exchange 20xxJ\lib\cdata.jdbc.exchange.jar
このcdata.jdbc.exchange.jar とcdata.jdbc.exchange.lic ファイルをコピーして、Neuron のC:\APP cf\lib フォルダに配置します。

Neuron CF でのMicrosoft Exchange のデータを扱うリポジトリの作成

Neuron CF でクローラーの設定をGUI で行います。JDBC を読み取るためのリポジトリを作成します。Neuron の管理画面にログインし、［リポジトリ］→［リポジトリコレクション一覧］→［新規］をクリックします。
任意のリポジトリ名を入力します。タイプは［JDBC］を選択します。
次に、ドライバーのクラス名とJDBC 接続文字列でMicrosoft Exchange への接続を行います。

Microsoft Exchange への接続

Exchange への接続には2つのスキーマがあります。
- Microsoft Graph
- Exchange Web Services（EWS）（非推奨）
  Note：Microsoft は、Exchange Online ユーザーに対してMicrosoft Graph への切り替えを推奨しています。
Microsoft Graph とEWS を切り替えるには、Schema をMSGraph またはEWS（非推奨）に設定します。
Microsoft Exchange OnPremises への認証
Microsoft Exchange OnPremises は、Basic（デフォルト）、Digest、Negotiate、NTLM 認証をサポートします。

Basic（デフォルト）
Microsoft Exchange OnPremises では、Basic がデフォルトの認証として設定されます。 Basic 認証を使用するには、以下のプロパティを設定します。
- AuthScheme：Basic。
- User：ユーザーのログインID。
- Password：ユーザーのログインパスワード。
他の認証方法については、ヘルプドキュメントの「はじめに」を参照してください。

Microsoft Exchange Online への認証
Microsoft Exchange Online は、複数のOAuth ベースの認証をサポートしています。 Microsoft Graph を介してExchange Online に接続する場合は、Schema をMSGraph に設定します。
認証方法の詳細は、ヘルプドキュメントの「はじめに」を参照してください。

ドライバクラス名：cdata.jdbc.exchange.ExchangeDriver
接続文字列：jdbc:exchange:User='myUser@mydomain.onmicrosoft.com';Password='myPassword';Server='https://outlook.office365.com/EWS/Exchange.asmx';Platform='Exchange_Online';
［更新］をクリックして、Microsoft Exchange に接続するリポジトリコレクションができました。

Neuron でMicrosoft Exchange のデータをクローリングするジョブを作成

続いて、Microsoft Exchange のどのデータをどのようにクローリングするのかをジョブで定義していきます。

管理画面で［ジョブ］→［ジョブ一覧］→［新規］とクリックします。
任意のジョブ名を入力します。出力先にはSolr を選択します。リポジトリは先ほど作成したMicrosoft Exchange に接続するリポジトリコレクションを選びます。
次に基本タブからジョブ実行を手動にするか、定期実行するかを自由に設定します。
SQL タブでは、どんなデータを取得するのか、テーブル名やカラム、フィルタリング条件などを設定できます。CData JDBC ドライバがMicrosoft Exchange のデータをテーブルにモデル化しているので、標準SQL でMicrosoft Exchange をクエリすることができます。
- SQL文：SELECT GivenName, Size FROM Contacts
- キーカラム：Id など取得テーブルのキーとなるカラム
- 検索対象カラム：検索の対象とするカラム
- タイトルカラム：検索結果のタイトルとするカラム
- タイムスタンプカラム：タイムスタンプとなるカラムがあれば、ここで指定します
リクエストパラメータでは、検索結果レコードのURL （があれば）を設定することもできます。URL を表示できると表示された検索結果からレコードに簡単に移動できます。
取得元では、ラベルを設定しておきます。［更新］をクリックして、クローラージョブの設定を完了します。