Dataiku からリアルタイム NetSuite データを使って AI/ML モデルを構築
Dataiku は、データの準備、分析、可視化、AI/ML モデルのデプロイメントに利用されるデータサイエンスおよび機械学習プラットフォームです。チームでの協業と効率的なデータドリブンな意思決定を可能にします。CData JDBC Driver for NetSuite と組み合わせることで、Dataiku は NetSuite のデータ のデータ連携、データ準備、リアルタイム分析、そして信頼性の高いモデルデプロイメントをさらに強化します。
CData JDBC Driver は、最適化されたデータ処理機能を内蔵しており、リアルタイム NetSuite のデータ とのやり取りにおいて比類のないパフォーマンスを発揮します。複雑な SQL クエリを NetSuite に発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を NetSuite に直接プッシュし、サポートされていない操作(多くの場合、SQL 関数や JOIN 操作)は内蔵の SQL エンジンを使用してクライアント側で処理します。動的メタデータクエリ機能が組み込まれているため、ネイティブのデータ型を使って NetSuite のデータ を操作・分析できます。
この記事では、Dataiku DSS(Data Science Studio)プラットフォームで CData JDBC Driver for NetSuite を使って NetSuite に簡単に連携する方法を紹介します。データの準備やカスタム AI/ML モデルの構築を行いましょう。
NetSuite データ連携について
CData は、Oracle NetSuite のライブデータにアクセスし、統合するための最も簡単な方法を提供します。お客様は CData の接続機能を以下の目的で使用しています:
- Standard、CRM、OneWorld を含む、すべてのエディションの NetSuite にアクセスできます。
- SuiteTalk API(SOAP ベース)のすべてのバージョンと、SQL のように機能し、より簡単なデータクエリと操作を可能にする SuiteQL に接続できます。
- Saved Searches のサポートにより、事前定義されたレポートとカスタムレポートにアクセスできます。
- トークンベースおよび OAuth 2.0 で安全に認証でき、あらゆるユースケースで互換性とセキュリティを確保します。
- SQL ストアドプロシージャを使用して、ファイルのアップロード・ダウンロード、レコードや関連付けのアタッチ・デタッチ、ロールの取得、追加のテーブルやカラム情報の取得、ジョブ結果の取得などの機能的なアクションを実行できます。
お客様は、Power BI や Excel などのお気に入りの分析ツールからライブ NetSuite データにアクセスするために CData ソリューションを使用しています。また、CData Sync を直接使用するか、Azure Data Factory などの他のアプリケーションとの CData の互換性を活用して、NetSuite データを包括的なデータベースやデータウェアハウスに統合しています。CData は、Oracle NetSuite のお客様が NetSuite からデータを取得し、NetSuite にデータをプッシュするアプリを簡単に作成できるよう支援し、他のソースからのデータを NetSuite と統合することを可能にしています。
当社の Oracle NetSuite ソリューションの詳細については、ブログをご覧ください:Drivers in Focus Part 2: Replicating and Consolidating ... NetSuite Accounting Data
はじめに
Dataiku DSS 環境の準備
このセクションでは、先に紹介した Dataiku を NetSuite のデータ 向けにセットアップする方法を説明します。事前に、お使いのオペレーティングシステムに対応した Dataiku DSS(オンプレミス版)をインストールしておいてください。
CData JDBC Driver for NetSuite のインストール
まず、Dataiku と同じマシンに CData JDBC Driver for NetSuite をインストールします。JDBC Driver は以下のパスにインストールされます:
C:\Program Files\CData[product_name] 20xx\lib\cdata.jdbc.netsuite.jar
Dataiku DSS での JDBC Driver 接続設定
Dataiku で CData JDBC Driver を使用するには、新しい SQL データベース接続を作成し、DSS の接続設定で JDBC Driver の JAR ファイルを追加する必要があります。
- Dataiku DSS プラットフォームにログインします。ブラウザでローカルに開きます(例:localhost:11200)。
- プラットフォームの右上にある Navigate to other sections of Dataiku メニューをクリックし、Administration を選択します。
- Connections タブを選択します。
- Connections 画面で New Connections ボタンをクリックします。
- スクロールして Other SQL databases を選択します。
NetSuite に接続するための JDBC URL を生成します。jdbc:netsuite: で始まり、その後にセミコロン区切りの接続文字列プロパティを続けます。
NetSuiteへの接続
NetSuite では、2種類のAPI でデータにアクセスできます。どちらのAPI を使用するかは、Schema 接続プロパティで以下のいずれかを選択して指定してください。
- SuiteTalk は、NetSuite との通信に使用されるSOAP ベースの従来から提供されているサービスです。幅広いエンティティをサポートし、INSERT / UPDATE / DELETE の操作も対応しています。ただし、SuiteQL API と比べるとデータの取得速度が劣ります。また、サーバーサイドでのJOIN に対応していないため、これらの処理はCData 製品がクライアントサイドで実行します。
- SuiteQL は、より新しいAPI です。JOIN、GROUP BY、集計、カラムフィルタリングをサーバーサイドで処理できるため、SuiteTalk よりもはるかに高速にデータを取得できます。ただし、NetSuite データへのアクセスは読み取り専用となります。
データの取得のみが目的でしたらSuiteQL をお勧めします。データの取得と変更の両方が必要な場合は、SuiteTalk をお選びください。
NetSuite への認証
CData 製品では、以下の認証方式がご利用いただけます。
- トークンベース認証(TBA)はOAuth1.0に似た仕組みです。2020.2以降のSuiteTalk とSuiteQL の両方で利用できます。
- OAuth 2.0 認証(OAuth 2.0 認可コードグラントフロー)は、SuiteQL でのみご利用いただけます。
- OAuth JWT 認証は、OAuth2.0 クライアント認証フローの一つで、クライアント認証情報を含むJWT を使用してNetSuite データへのアクセスを要求します。
トークンベース認証(OAuth1.0)
トークンベース認証(TBA)は、基本的にOAuth 1.0 の仕組みです。この認証方式はSuiteTalk とSuiteQL の両方でサポートされています。管理者権限をお持ちの方がNetSuite UI 内でOAuthClientId、OAuthClientSecret、OAuthAccessToken、OAuthAccessTokenSecret を直接作成することで設定できます。 NetSuite UI でのトークン作成手順については、ヘルプドキュメントの「はじめに」セクションをご参照ください。
アクセストークンを作成したら、以下の接続プロパティを設定して接続してみましょう。
- AuthScheme = Token
- AccountId = 接続先のアカウント
- OAuthClientId = アプリケーション作成時に表示されるコンシューマーキー
- OAuthClientSecret = アプリケーション作成時に表示されるコンシューマーシークレット
- OAuthAccessToken = アクセストークン作成時のトークンID
- OAuthAccessTokenSecret = アクセストークン作成時のトークンシークレット
その他の認証方法については、ヘルプドキュメントの「はじめに」をご確認ください。
組み込みの接続文字列デザイナー
JDBC URL の作成には、NetSuite JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから実行してください。
java -jar cdata.jdbc.netsuite.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
一般的な JDBC URL は次のようになります:
jdbc:netsuite:AccountId=XABC123456;Schema=SuiteTalk;AuthScheme=Token;OAuthClientId=MyOAuthClientId;OAuthClientSecret=MyOAuthClientSecret;OAuthAccessToken=MyOAuthAccessToken;OAuthAccessTokenSecret=MyOAuthAccessTokenSecret;
- New SQL database (JDBC) connection 画面で、New connection name フィールドに名前を入力し、基本パラメータを指定します:
- JDBC Driver Class:cdata.jdbc.netsuite.NetSuiteDriver
- JDBC URL:前のステップで取得した JDBC 接続 URL
- Driver jars directory:システム上で JAR ファイルがインストールされているフォルダパス
次に、SQL dialect を選択します。ここでは「SQL Server」を選択しています。Create をクリックします。接続が成功すると、「Connection OK」というメッセージが表示されます。
- Data Catalog ウィンドウが表示されます。Connection to browse、Restrict to catalog、Restrict to schema ドロップダウンから目的の接続、カタログ、スキーマを選択し、List Tables をクリックします。Dataiku プラットフォームに必要なテーブルがすべて一覧表示されます。
- 一覧からテーブルを選択し、Preview をクリックしてテーブルデータを表示します。Close をクリックしてウィンドウを閉じます。
新しいプロジェクトの作成
Dataiku DSS プラットフォームでデータフローの準備、ダッシュボードの作成、NetSuite のデータ の分析、AI/ML モデルの構築を行うには、まず新しいプロジェクトを作成する必要があります。
- Navigate to other sections of Dataiku メニューから Projects を選択します。
- Projects 画面で New Project をクリックし、+ Blank Project を選択します。
- New Project ウィンドウで、Name と Project Key を入力します。Create をクリックすると、新しいプロジェクトのダッシュボードが開きます。
- プロジェクト画面上部のメニューから Notebooks を選択します。
- + Create Your First Notebook ドロップダウンメニューをクリックし、Write your own オプションを選択します。
- New Notebook ウィンドウで SQL を選択します。
- Connection ドロップダウンから必要な接続を選択し、Notebook Name フィールドに名前を入力します。
接続のテスト
NetSuite 接続をテストして NetSuite のデータ を分析するには、クエリコンパイラでクエリを記述し、Run をクリックします。クエリ結果やフィルタリングされた NetSuite のデータ の結果が画面に表示されます。
おわりに
CData JDBC Driver for NetSuite の 30日間無償トライアル をダウンロードして、Dataiku と連携し、NetSuite のデータ からカスタム AI/ML モデルを簡単に構築しましょう。
ご質問があれば、お気軽に サポートチーム までお問い合わせください。