Oracle Data Integrator で IBM Cloud Object Storage データをETL

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Oracle Data Integrator を使用してIBM Cloud Object Storage のデータをデータウェアハウスに転送する方法を説明します。

JDBC 標準を使用して、既存のスキルを活かしながらIBM Cloud Object Storage に接続できます。 Oracle Data Integrator(ODI)などの ETL ツールにドロップインで統合できる CData JDBC Driver for IBM Cloud Object Storage を使えば、リアルタイムのIBM Cloud Object Storage のデータをデータウェアハウス、ビジネスインテリジェンス、ビッグデータテクノロジーに接続できます。

JDBC 接続により、ODI でIBM Cloud Object Storage を他のデータベースと同様に扱うことができます。RDBMS と同じように、フラットファイルではなくリアルタイムでIBM Cloud Object Storage API に直接接続できます。

この記事では、JDBC ベースの ETL(IBM Cloud Object Storage から Oracle へ)の手順を説明します。IBM Cloud Object Storage エンティティのデータモデルをリバースエンジニアリングした後、マッピングを作成し、データロード戦略を選択します。ドライバーが SQL-92 をサポートしているため、組み込みの SQL to SQL Loading Knowledge Module を選択するだけで簡単に実現できます。

ドライバーのインストール

ドライバーをインストールするには、インストールフォルダにあるドライバー JAR(cdata.jdbc.ibmcloudobjectstorage.jar)と .lic ファイル(cdata.jdbc.ibmcloudobjectstorage.lic)を、ODI の適切なディレクトリにコピーします。

  • UNIX/Linux(エージェントなし): ~/.odi/oracledi/userlib
  • UNIX/Linux(エージェントあり): ~/.odi/oracledi/userlib および $ODI_HOME/odi/agent/lib
  • Windows(エージェントなし): %APPDATA%\Roaming\odi\oracledi\userlib
  • Windows(エージェントあり): %APPDATA%\odi\oracledi\userlib および %APPDATA%\odi\agent\lib

ODI を再起動してインストールを完了します。

モデルのリバースエンジニアリング

モデルをリバースエンジニアリングすると、ドライバーのIBM Cloud Object Storage のデータに対するリレーショナルビューのメタデータが取得されます。リバースエンジニアリング後は、リアルタイムのIBM Cloud Object Storage のデータをクエリし、IBM Cloud Object Storage テーブルに基づいてマッピングを作成できます。

  1. ODI でリポジトリに接続し、New -> Model and Topology Objects をクリックします。
  2. 表示されるダイアログの Model 画面で、以下の情報を入力します。
    • Name: IBMCloudObjectStorage と入力します。
    • Technology: Generic SQL を選択します(ODI バージョン 12.2 以降の場合は Microsoft SQL Server を選択)。
    • Logical Schema: IBMCloudObjectStorage と入力します。
    • Context: Global を選択します。
  3. 表示されるダイアログの Data Server 画面で、以下の情報を入力します。
    • Name: IBMCloudObjectStorage と入力します。
    • Driver List: Oracle JDBC Driver を選択します。
    • Driver: cdata.jdbc.ibmcloudobjectstorage.IBMCloudObjectStorageDriver と入力します。
    • URL: 接続文字列を含む JDBC URL を入力します。

      Cloud Object Storage 接続プロパティの取得・設定方法

      Cloud Object Storage に接続する前に、Cloud Object Storage インスタンスを登録してCloud Object Storage API キーとCRN を取得していきます。

      Cloud Object Storage の新規インスタンスの登録

      IBM Cloud アカウントにCloud Object Storage がまだない場合は、以下の手順に従ってアカウントにSQL Query のインスタンスをインストールできます。

      1. IBM Cloud アカウントにログインします。
      2. Cloud Object Storage ページに移動して、インスタンス名を指定して「作成」をクリックします。Cloud Object Storage の新規インスタンスにリダイレクトされます。

      API キー

      API キーは以下の手順で取得できます。

      1. まずは、IBM Cloud アカウントにログインします。
      2. API キーページに移動します。
      3. 中央右隅のIBM Cloud APIキーの作成 をクリックして、新しいAPI キーを作成します。
      4. ポップアップウィンドウが表示されたら、API キーの名前を指定して作成をクリックします。ダッシュボードからはアクセスできなくなるため、API Key を控えておきましょう。

      Cloud Object Storage CRN

      デフォルトでは、CData 製品はCloud Object Storage CRN を自動で取得します。ただし、複数のアカウントがある場合は、CloudObjectStorageCRN を明示的に指定する必要があります。この値は、次の2つの方法で取得できます。

      • Services ビューをクエリする。これにより、IBM Cloud Object Storage インスタンスとそれぞれのCRN がリストされます。
      • IBM Cloud で直接CRN を見つける。これを行うには、IBM Cloud のダッシュボードに移動します。リソースリストで、ストレージからCloud Object Storage リソースを選択してCRN を取得します。

      IBM Cloud Object Storage への接続

      これで準備は完了です。以下の接続プロパティを設定してください。

      • InitiateOAuthGETANDREFRESH に設定。InitiateOAuth を使うと、OAuth 認証を繰り返す必要がなく、さらに自動でアクセストークンを設定できます。
      • ApiKey:セットアップ中に控えたAPI キーを指定。
      • CloudObjectStorageCRN(オプション):控えておいたCloud Object Storage のCRN に設定。Cloud Object Storage アカウントが複数ある場合のみ設定する必要があります。

      プロパティを設定したら、これで接続設定は完了です。

      組み込みの接続文字列デザイナー

      JDBC URL の作成には、IBM Cloud Object Storage JDBC Driver に組み込まれている接続文字列デザイナーをご利用ください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。

      java -jar cdata.jdbc.ibmcloudobjectstorage.jar
      

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      一般的な接続文字列は以下のとおりです。

      jdbc:ibmcloudobjectstorage:ApiKey=myApiKey;CloudObjectStorageCRN=MyInstanceCRN;Region=myRegion;OAuthClientId=MyOAuthClientId;OAuthClientSecret=myOAuthClientSecret;
      
  4. Physical Schema 画面で、以下の情報を入力します。
    • Name: ドロップダウンメニューから選択します。
    • Database (Catalog): CData と入力します。
    • Owner (Schema): IBM Cloud Object Storage でスキーマを選択した場合は選択したスキーマを入力し、それ以外の場合は IBMCloudObjectStorage と入力します。
    • Database (Work Catalog): CData と入力します。
    • Owner (Work Schema): IBM Cloud Object Storage でスキーマを選択した場合は選択したスキーマを入力し、それ以外の場合は IBMCloudObjectStorage と入力します。
  5. 開いたモデルで Reverse Engineer をクリックして、IBM Cloud Object Storage テーブルのメタデータを取得します。

IBM Cloud Object Storage のデータの編集と保存

リバースエンジニアリングが完了すると、ODI でIBM Cloud Object Storage のデータを操作できるようになります。 IBM Cloud Object Storage のデータを表示するには、Designer ナビゲーターで Models アコーディオンを展開し、テーブルを右クリックして View data をクリックします。

ETL プロジェクトの作成

以下の手順に従って、IBM Cloud Object Storage からの ETL を作成します。ODI Getting Started VM に含まれるサンプルデータウェアハウスに Objects エンティティをロードします。

  1. SQL Developer を開き、Oracle データベースに接続します。Connections ペインでデータベースのノードを右クリックし、new SQL Worksheet をクリックします。

    または、SQLPlus を使用することもできます。コマンドプロンプトから以下を入力します。

    sqlplus / as sysdba
    
  2. 以下のクエリを入力して、ODI_DEMO スキーマにあるサンプルデータウェアハウスに新しいターゲットテーブルを作成します。以下のクエリでは、IBM Cloud Object Storage の Objects テーブルに対応するいくつかのカラムを定義しています。
    CREATE TABLE ODI_DEMO.TRG_OBJECTS (ETAG NUMBER(20,0),Key VARCHAR2(255));
    
  3. ODI で Designer ナビゲーターの Models アコーディオンを展開し、ODI_DEMO フォルダ内の Sales Administration ノードをダブルクリックします。モデルエディターでモデルが開きます。
  4. Reverse Engineer をクリックします。TRG_OBJECTS テーブルがモデルに追加されます。
  5. プロジェクト内の Mappings ノードを右クリックし、New Mapping をクリックします。マッピングの名前を入力し、Create Empty Dataset オプションのチェックを外します。Mapping Editor が表示されます。
  6. Sales Administration モデルから TRG_OBJECTS テーブルをマッピングにドラッグします。
  7. IBM Cloud Object Storage モデルから Objects テーブルをマッピングにドラッグします。
  8. ソースのコネクタポイントをクリックし、ターゲットのコネクタポイントにドラッグします。Attribute Matching ダイアログが表示されます。この例では、デフォルトのオプションを使用します。ターゲットカラムのプロパティにターゲット式が表示されます。
  9. Mapping Editor の Physical タブを開き、TARGET_GROUP 内の OBJECTS_AP をクリックします。
  10. OBJECTS_AP のプロパティで、Loading Knowledge Module タブの LKM SQL to SQL (Built-In) を選択します。

マッピングを実行して、IBM Cloud Object Storage のデータを Oracle にロードできます。

はじめる準備はできましたか?

IBM Cloud Object Storage Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

IBM Cloud Object Storage Icon IBM Cloud Object Storage JDBC Driver お問い合わせ

IBM Cloud Object Storage データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。