Python で pandas を使って SharePoint Excel Services データを可視化する方法

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
pandas などのモジュールを使って Python で SharePoint Excel Services のデータをリアルタイムに分析・可視化する方法を紹介します。

Python の豊富なエコシステムを活用することで、作業を迅速に開始し、システム間の連携をより効果的に行うことができます。CData Python Connector for SharePoint Excel Services、pandas および Matplotlib モジュール、SQLAlchemy ツールキットを組み合わせることで、SharePoint Excel Services に接続した Python アプリケーションやスクリプトを構築し、SharePoint Excel Services のデータを可視化できます。この記事では、pandas、SQLAlchemy、Matplotlib の組み込み関数を使用して SharePoint Excel Services のデータに接続し、クエリを実行して結果を可視化する方法を説明します。

CData Python Connector は、組み込みの最適化されたデータ処理機能により、Python での SharePoint Excel Services のデータへのリアルタイムアクセスにおいて比類のないパフォーマンスを提供します。SharePoint Excel Services に対して複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を SharePoint Excel Services に直接プッシュし、サポートされていない操作(多くの場合、SQL 関数や JOIN 操作)は組み込みの SQL エンジンを使用してクライアント側で処理します。

SharePoint Excel Services のデータへの接続

SharePoint Excel Services のデータへの接続は、他のリレーショナルデータソースへの接続と同様です。必要な接続プロパティを使用して接続文字列を作成します。この記事では、接続文字列を create_engine 関数のパラメータとして渡します。

ワークブックへの接続

どちらのSharePoint エディションをお使いでも、File を Excel ワークブックに設定してください。このパスは以下のプロパティからの相対パスになります。

  • Library:デフォルトではShared Documents ライブラリが使用されます。このプロパティを使って、組織内の別のドキュメントライブラリを指定してみてください。例えば、OneDrive for Business に接続する場合は、このプロパティを"Documents" に設定します。
  • Folder:このプロパティを使って、ライブラリ内のサブフォルダへのパスを指定できます。パスはLibrary で指定されたライブラリ名に関連します。

テーブルとしてのスプレッドシートデータへの接続

CData 製品では、基底API で利用可能なオブジェクトに基づいて、使用可能なテーブルを検出していきます。

API では異なるAPI オブジェクトを表示します。スプレッドシートの構成とSharePoint のバージョンに基づいてAPI を選択しましょう。

  • OData: OData API を使用すると、Excel で[挿入]->[テーブル]をクリックして作成されたExcel テーブルオブジェクト(範囲やスプレッドシートではありません)から定義されたテーブルにアクセスできます。OData API に接続する際、ワークブックにテーブルオブジェクトが定義されていない場合は、CData 製品がテーブルを返さないことがあります。テーブルとしてスプレッドシートまたは範囲に接続するには、UseRESTAPI をtrue に設定してください。
  • REST: REST API を使用すると、Excel テーブルオブジェクト、範囲、およびスプレッドシートから定義されたテーブルへアクセスできます。これがデフォルトの API です。範囲およびスプレッドシートから多数の行をリクエストすることは REST API によって制限されており、CData 製品では返される行数をデフォルトで 100 に制限しています。また CData 製品では、デフォルトで1行目からカラム名を検出します。これを無効にするには、Header を設定してください。

DefineTables を追加設定すると、Excel の範囲の構文を使用して、範囲に基づいてテーブルを定義できます。大きすぎる範囲は、API によって制限されます。

SharePoint オンプレミスへの接続

URL をサーバー名もしくはIP アドレスに設定しましょう。さらに、SharePointVersion と認証値を設定します。

SharePoint OnPremises を認証するには、AuthScheme を認証タイプに設定し、必要に応じてUserPassword を設定してください。

Note:SharePoint On-Premises 2010 に接続する場合は、 UseRESTAPI をtrue に設定する必要があります。

    Windows(NTLM)

    最も一般的な認証タイプです。CData 製品では NTLM をデフォルトとして使用するよう事前設定されています。Windows のUserPassword を設定して接続してください。

    その他の認証方法については、ヘルプドキュメントの「はじめに」をご覧ください。

    以下の手順に従って、必要なモジュールをインストールし、Python オブジェクトを介して SharePoint Excel Services にアクセスしてみましょう。

    必要なモジュールのインストール

    pip ユーティリティを使用して、pandas、Matplotlib モジュール、および SQLAlchemy ツールキットをインストールします。

    pip install pandas
    pip install matplotlib
    pip install sqlalchemy

    以下のようにモジュールをインポートしてください。

    import pandas
    import matplotlib.pyplot as plt
    from sqlalchemy import create_engine

    Python で SharePoint Excel Services のデータを可視化する

    接続文字列を使用して接続できます。create_engine 関数を使用して、SharePoint Excel Services のデータを操作するための Engine を作成します。

    engine = create_engine("excelservices:///?URL=https://myorg.sharepoint.com&User=admin@myorg.onmicrosoft.com&Password=password&File=Book1.xlsx")
    

    SharePoint Excel Services への SQL の実行

    pandas の read_sql 関数を使用して、SQL ステートメントを実行し、結果セットを DataFrame に格納します。

    df = pandas.read_sql("SELECT Name, AnnualRevenue FROM Account WHERE Industry = 'Floppy Disks'", engine)
    

    SharePoint Excel Services のデータの可視化

    クエリ結果が DataFrame に格納されたら、plot 関数を使用して SharePoint Excel Services のデータを表示するグラフを作成します。show メソッドで、グラフを新しいウィンドウに表示します。

    df.plot(kind="bar", x="Name", y="AnnualRevenue")
    plt.show()

    無料トライアル & 詳細情報

    CData Python Connector for SharePoint Excel Services の 30日間無料トライアルをダウンロードして、SharePoint Excel Services のデータに接続する Python アプリケーションやスクリプトの構築を始めましょう。ご質問がありましたら、サポートチームまでお気軽にお問い合わせください。



    完全なソースコード

    import pandas
    import matplotlib.pyplot as plt
    from sqlalchemy import create_engin
    
    engine = create_engine("excelservices:///?URL=https://myorg.sharepoint.com&User=admin@myorg.onmicrosoft.com&Password=password&File=Book1.xlsx")
    df = pandas.read_sql("SELECT Name, AnnualRevenue FROM Account WHERE Industry = 'Floppy Disks'", engine)
    
    df.plot(kind="bar", x="Name", y="AnnualRevenue")
    plt.show()
    

はじめる準備はできましたか?

SharePoint Excel Services Connector のコミュニティライセンスをダウンロード:

 ダウンロード

詳細:

SharePoint Excel Services Icon SharePoint Excel Services Python Connector お問い合わせ

SharePoint Excel Services データ連携用のPython Connector ライブラリ。pandas、SQLAlchemy、Dash、petl などの主要なPython ツールにSharePoint Excel Services をシームレスに統合。