Informatica Enterprise Data Catalog で SharePoint Excel Services のデータ を追加

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
CData JDBC Driver for SharePoint Excel Services を Informatica Enterprise Data Catalog で使用し、データを分類・整理します。

Informatica は、データの転送と変換を行うための強力で洗練された手段を提供します。CData JDBC Driver for SharePoint Excel Services を使用すると、業界標準に準拠したドライバーを通じて Informatica Enterprise Data Catalog とシームレスに連携できます。このチュートリアルでは、あらゆる環境で SharePoint Excel Services データを分類・整理する方法を説明します。

JDBC ドライバーのロード

JDBC ドライバーをロードするには:

  1. Informatica が動作しているホストに JDBC ドライバーをインストールします。この記事では、ドライバーが cdata.jdbc.excelservices.ExcelServicesDriver にインストールされていることを前提としています。
  2. $ java -jar setup.jar
    
  3. JDBC インストールディレクトリに移動し、ドライバーとそのライセンスファイルを含む genericJDBC.zip という名前の zip ファイルを作成します。
  4. $ cd ~/cdata-jdbc-driver-for-excelservices/lib
    $ zip genericJDBC.zip cdata.jdbc.excelservices.jar cdata.jdbc.excelservices.lic
    
  5. genericJDBC.zip ファイルを Informatica 内の Catalog Service ディレクトリに移動します。この記事では、Informatica が /opt/informatica にインストールされていることを前提としています。このフォルダでの作業には、おそらく root 権限が必要です。続行する前に、su または sudo で root に切り替えてください。
  6. # mv genericJDBC.zip /opt/informatica/services/CatalogService/ScannerBinaries
    
  7. zip ファイルを展開するために、カスタムデプロイメント設定を編集します。
  8. # cd /opt/informatica/services/CatalogService/ScannerBinaries/CustomDeployer/
    # nano scannerDeployer.xml
    

    既存の ExecutionContextProperty ノードを展開した後、以下の内容で新しい ExecutionContextProperty ノードを追加します。

    
    <ExecutionContextProperty
        isLocationProperty="true"
        dependencyToUnpack="genericJDBC.zip">
    <PropertyName>JDBCScanner_DriverLocation</PropertyName>
    <PropertyValue>scanner_miti/genericJDBC/Drivers</PropertyValue>
    </ExecutionContextProperty>
    
  9. Admin コンソールから Catalog Service をリフレッシュします。

JDBC リソースの設定

JDBC リソースを設定するには:

  1. Catalog 管理画面を開き、以下のプロパティで新しい JDBC リソースを追加します:
    • Driver Class: cdata.jdbc.excelservices.ExcelServicesDriver
    • URL: jdbc.excelservices:URL=https://myorg.sharepoint.com;User=admin@myorg.onmicrosoft.com;Password=password;File=Book1.xlsx;
    • ワークブックへの接続

      どちらのSharePoint エディションをお使いでも、File を Excel ワークブックに設定してください。このパスは以下のプロパティからの相対パスになります。

      • Library:デフォルトではShared Documents ライブラリが使用されます。このプロパティを使って、組織内の別のドキュメントライブラリを指定してみてください。例えば、OneDrive for Business に接続する場合は、このプロパティを"Documents" に設定します。
      • Folder:このプロパティを使って、ライブラリ内のサブフォルダへのパスを指定できます。パスはLibrary で指定されたライブラリ名に関連します。

      テーブルとしてのスプレッドシートデータへの接続

      CData 製品では、基底API で利用可能なオブジェクトに基づいて、使用可能なテーブルを検出していきます。

      API では異なるAPI オブジェクトを表示します。スプレッドシートの構成とSharePoint のバージョンに基づいてAPI を選択しましょう。

      • OData: OData API を使用すると、Excel で[挿入]->[テーブル]をクリックして作成されたExcel テーブルオブジェクト(範囲やスプレッドシートではありません)から定義されたテーブルにアクセスできます。OData API に接続する際、ワークブックにテーブルオブジェクトが定義されていない場合は、CData 製品がテーブルを返さないことがあります。テーブルとしてスプレッドシートまたは範囲に接続するには、UseRESTAPI をtrue に設定してください。
      • REST: REST API を使用すると、Excel テーブルオブジェクト、範囲、およびスプレッドシートから定義されたテーブルへアクセスできます。これがデフォルトの API です。範囲およびスプレッドシートから多数の行をリクエストすることは REST API によって制限されており、CData 製品では返される行数をデフォルトで 100 に制限しています。また CData 製品では、デフォルトで1行目からカラム名を検出します。これを無効にするには、Header を設定してください。

      DefineTables を追加設定すると、Excel の範囲の構文を使用して、範囲に基づいてテーブルを定義できます。大きすぎる範囲は、API によって制限されます。

      SharePoint オンプレミスへの接続

      URL をサーバー名もしくはIP アドレスに設定しましょう。さらに、SharePointVersion と認証値を設定します。

      SharePoint OnPremises を認証するには、AuthScheme を認証タイプに設定し、必要に応じてUserPassword を設定してください。

      Note:SharePoint On-Premises 2010 に接続する場合は、 UseRESTAPI をtrue に設定する必要があります。

        Windows(NTLM)

        最も一般的な認証タイプです。CData 製品では NTLM をデフォルトとして使用するよう事前設定されています。Windows のUserPassword を設定して接続してください。

        その他の認証方法については、ヘルプドキュメントの「はじめに」をご覧ください。

        組み込みの接続文字列デザイナー

        JDBC URL の構築については、SharePoint Excel Services JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。.jar ファイルをダブルクリックするか、コマンドラインから .jar ファイルを実行します。

        java -jar cdata.jdbc.excelservices.jar
        

        接続プロパティを入力し、接続文字列をクリップボードにコピーします。

        JDBC URL を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数が制限され、レポートやビジュアライゼーションの設計時にパフォーマンスを向上させることができます。

      一般的な追加の接続文字列プロパティは以下のとおりです:

      JDBC;MSTR_JDBC_JAR_FOLDER=PATH\TO\JAR\;DRIVER=cdata.jdbc.excelservices.ExcelServicesDriver;URL={jdbc:excelservices:URL=https://myorg.sharepoint.com;User=admin@myorg.onmicrosoft.com;Password=password;File=Book1.xlsx;};
      
    • Username: user
    • Password: password

    Username と Password プロパティは、使用するドライバーが必要としない場合でも必須です。その場合は、代わりにプレースホルダー値を入力してください。

  2. 少なくとも1つのソースメタデータスキャンを実行するために、メタデータオプションを設定します。このスキャンでは、ドライバーを使用してサービス経由で利用可能なテーブル、ビュー、ストアドプロシージャを特定します。
    • Source Metadata: このオプションを有効にします。
    • Catalog: マルチカタログのデータソースの場合は、適切なカタログに設定します。それ以外の場合は、CData に設定します。
    • Schema: マルチスキーマのデータソースの場合は、適切なスキーマに設定します。それ以外の場合は、サービス名(例:Couchbase)に設定します。
    • Case-sensitivity: 通常、このオプションは無効にしてください。大文字と小文字を区別するデータソースの場合のみ有効にします。
    • Import stored procedures: テーブルやビューに加えてストアドプロシージャの定義もインポートしたい場合は、これを有効にします。

    必要に応じて、他のメタデータスキャナーも有効にできます。

  3. ドライバーの設定を完了し、オプションでカスタム属性とスキャナースケジュールを設定します。
  4. Monitoring タブに移動し、Run をクリックしてメタデータスキャンを実行します。データソースによっては、数分かかる場合があります。

スキャンが完了すると、すべてのメタデータオブジェクトの概要と Metadata Load ジョブのステータスが表示されます。エラーが発生した場合は、ジョブの Log Location リンクを開いて、Informatica またはドライバーが報告したエラーを確認できます。

検出されたメタデータの確認

Catalog Service ブラウザを開いて、データソースから抽出されたメタデータを表示します。メタデータスキャナーの設定時に選択したオプションに応じて、定義したリソースのテーブル、ビュー、ストアドプロシージャの任意の組み合わせが表示されます。

はじめる準備はできましたか?

SharePoint Excel Services Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

SharePoint Excel Services Icon SharePoint Excel Services JDBC Driver お問い合わせ

SharePoint サーバーでホストされているリアルタイムなExcel スプレッドシートコンテンツを組み込んだパワフルなJava アプリケーションを短時間・低コストで作成して配布できます。