Dataiku からリアルタイム SAP SuccessFactors データを使って AI/ML モデルを構築
Dataiku は、データの準備、分析、可視化、AI/ML モデルのデプロイメントに利用されるデータサイエンスおよび機械学習プラットフォームです。チームでの協業と効率的なデータドリブンな意思決定を可能にします。CData JDBC Driver for SAP SuccessFactors と組み合わせることで、Dataiku は SAP SuccessFactors のデータ のデータ連携、データ準備、リアルタイム分析、そして信頼性の高いモデルデプロイメントをさらに強化します。
CData JDBC Driver は、最適化されたデータ処理機能を内蔵しており、リアルタイム SAP SuccessFactors のデータ とのやり取りにおいて比類のないパフォーマンスを発揮します。複雑な SQL クエリを SAP SuccessFactors に発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を SAP SuccessFactors に直接プッシュし、サポートされていない操作(多くの場合、SQL 関数や JOIN 操作)は内蔵の SQL エンジンを使用してクライアント側で処理します。動的メタデータクエリ機能が組み込まれているため、ネイティブのデータ型を使って SAP SuccessFactors のデータ を操作・分析できます。
この記事では、Dataiku DSS(Data Science Studio)プラットフォームで CData JDBC Driver for SAP SuccessFactors を使って SAP SuccessFactors に簡単に連携する方法を紹介します。データの準備やカスタム AI/ML モデルの構築を行いましょう。
Dataiku DSS 環境の準備
このセクションでは、先に紹介した Dataiku を SAP SuccessFactors のデータ 向けにセットアップする方法を説明します。事前に、お使いのオペレーティングシステムに対応した Dataiku DSS(オンプレミス版)をインストールしておいてください。
CData JDBC Driver for SAP SuccessFactors のインストール
まず、Dataiku と同じマシンに CData JDBC Driver for SAP SuccessFactors をインストールします。JDBC Driver は以下のパスにインストールされます:
C:\Program Files\CData[product_name] 20xx\lib\cdata.jdbc.sapsuccessfactors.jar
Dataiku DSS での JDBC Driver 接続設定
Dataiku で CData JDBC Driver を使用するには、新しい SQL データベース接続を作成し、DSS の接続設定で JDBC Driver の JAR ファイルを追加する必要があります。
- Dataiku DSS プラットフォームにログインします。ブラウザでローカルに開きます(例:localhost:11200)。
- プラットフォームの右上にある Navigate to other sections of Dataiku メニューをクリックし、Administration を選択します。
- Connections タブを選択します。
- Connections 画面で New Connections ボタンをクリックします。
- スクロールして Other SQL databases を選択します。
SAP SuccessFactors に接続するための JDBC URL を生成します。jdbc:sapsuccessfactors: で始まり、その後にセミコロン区切りの接続文字列プロパティを続けます。
SAP SuccessFactorsへの接続
それでは、SAP SuccessFactors に接続していきましょう。CData 製品は、デフォルトで有効になっているOData API を介してSAP SuccessFactors と通信します。追加の権限が必要な場合は、SAP サポートサイトをご確認ください。
認証方法として、Azure AD 認証、SAP IAS 認証、OAuth 認証(推奨)、Basic 認証(非推奨)のいずれかを使用してSAP SuccessFactors に認証できます。
必要な接続プロパティ
選択したAuthScheme に関わらず、SAP SuccessFactors 環境を識別するために以下の接続プロパティを設定しましょう。
- URL:SuccessFactors をホストするサーバーのURL
- CompanyId:SAP SuccessFactors テナントに割り当てられた一意の識別子。この値はAPI 認証に必要で、組織固有のものです
OAuth 認証
SAP SuccessFactors では、OAuth 認証を2種類のグラント種別でサポートしています。
- SAP SuccessFactors LMS インスタンスのクライアントグラント種別
- SAML-2 Bearer グラント種別
OAuth 認証を有効にするには、すべてのOAuth フローでカスタムOAuth アプリケーションを作成し、適切なプロパティを設定する必要があります。
デスクトップアプリケーションでカスタムOAuth アプリケーションの資格情報を使用して認証するには、OAuth アクセストークンを取得し、更新する必要があります。これらを設定すると、接続の準備が整います。
OAuth アクセストークンの取得およびリフレッシュ
以下のプロパティを設定してください。
- InitiateOAuth:GETANDREFRESH。OAuthAccessToken を自動的に取得およびリフレッシュするために使用します
- OAuthClientId:アプリケーションの登録時に割り当てられたクライアントId
- CallbackURL:カスタムOAuth アプリケーションの登録時に定義されたリダイレクトURI
- OAuthClientSecret (クライアントグラント種別のみ):アプリケーションの登録時に割り当てられたクライアントシークレット
- PrivateKey (SAML-2 Bearer グラント種別のみ):カスタムOAuth アプリケーションの作成時にダウンロードした秘密鍵証明書のパス、またはその証明書のbase64 でエンコードされた内容
接続すると、CData 製品がデフォルトブラウザでSAP SuccessFactors のOAuth エンドポイントを開きます。ログインして、アプリケーションにアクセス許可を与えてください。
アプリケーションにアクセス許可を与えると、CData 製品がOAuth プロセスを完了します。
- CData 製品がSAP SuccessFactors からアクセストークンを取得し、それを使ってデータをリクエストします
- OAuth 値はOAuthSettingsLocation で指定されたパスに保存されます。これらの値は接続間で永続化されます
アクセストークンの期限が切れた際は、CData 製品が自動でアクセストークンをリフレッシュします。
カスタムOAuth アプリケーションの作成やその他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「はじめに」をご確認ください。
組み込みの接続文字列デザイナー
JDBC URL の作成には、SAP SuccessFactors JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから実行してください。
java -jar cdata.jdbc.sapsuccessfactors.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
一般的な JDBC URL は次のようになります:
jdbc:sapsuccessfactors:User=username;Password=password;CompanyId=CompanyId;Url=https://api4.successfactors.com;
- New SQL database (JDBC) connection 画面で、New connection name フィールドに名前を入力し、基本パラメータを指定します:
- JDBC Driver Class:cdata.jdbc.sapsuccessfactors.SAPSuccessFactorsDriver
- JDBC URL:前のステップで取得した JDBC 接続 URL
- Driver jars directory:システム上で JAR ファイルがインストールされているフォルダパス
次に、SQL dialect を選択します。ここでは「SQL Server」を選択しています。Create をクリックします。接続が成功すると、「Connection OK」というメッセージが表示されます。
- Data Catalog ウィンドウが表示されます。Connection to browse、Restrict to catalog、Restrict to schema ドロップダウンから目的の接続、カタログ、スキーマを選択し、List Tables をクリックします。Dataiku プラットフォームに必要なテーブルがすべて一覧表示されます。
- 一覧からテーブルを選択し、Preview をクリックしてテーブルデータを表示します。Close をクリックしてウィンドウを閉じます。
新しいプロジェクトの作成
Dataiku DSS プラットフォームでデータフローの準備、ダッシュボードの作成、SAP SuccessFactors のデータ の分析、AI/ML モデルの構築を行うには、まず新しいプロジェクトを作成する必要があります。
- Navigate to other sections of Dataiku メニューから Projects を選択します。
- Projects 画面で New Project をクリックし、+ Blank Project を選択します。
- New Project ウィンドウで、Name と Project Key を入力します。Create をクリックすると、新しいプロジェクトのダッシュボードが開きます。
- プロジェクト画面上部のメニューから Notebooks を選択します。
- + Create Your First Notebook ドロップダウンメニューをクリックし、Write your own オプションを選択します。
- New Notebook ウィンドウで SQL を選択します。
- Connection ドロップダウンから必要な接続を選択し、Notebook Name フィールドに名前を入力します。
接続のテスト
SAP SuccessFactors 接続をテストして SAP SuccessFactors のデータ を分析するには、クエリコンパイラでクエリを記述し、Run をクリックします。クエリ結果やフィルタリングされた SAP SuccessFactors のデータ の結果が画面に表示されます。
おわりに
CData JDBC Driver for SAP SuccessFactors の 30日間無償トライアル をダウンロードして、Dataiku と連携し、SAP SuccessFactors のデータ からカスタム AI/ML モデルを簡単に構築しましょう。
ご質問があれば、お気軽に サポートチーム までお問い合わせください。