【ノーコード】Shopify のデータをCSV ファイルに連携する方法

宮本航太
宮本航太
プロダクトスペシャリスト
非エンジニアでも3ステップでCSV にShopify のデータを統合し、データ分析基盤の構築する方法を紹介。ノーコードETL / ELT ツールCData Sync を使ってノンプログラミングでデータ連携を自動化。CDCにも対応。



CData Sync は、数百のSaaS / DB のデータをCSV をはじめとする各種DB / データウェアハウスにノーコードで統合・レプリケーション(複製)が可能なETL / ELT ツールです。本記事では、Shopify のデータをCData Sync を使ってCSV に統合するデータパイプラインを作っていきます。CSV は、オンプレミスのCSV のほかAWS RDS やGoogle Cloud SQL などクラウド上のCSV にもレプリケーションが可能です。

CData Sync とは?

CData Sync の概要画像

CData Sync は、レポーティング、アナリティクス、機械学習、AI などで使えるよう、社内のデータを一か所に統合して管理できるデータ基盤をノーコードで構築できるETL ツールで、以下の特徴を持っています。

  1. Shopify をはじめとする数百種類のSaaS / DB データに対応
  2. CSV など多くのRDB、データレイク、データストア、データウェアハウスに同期可能
  3. 業務データのデータ分析基盤へのETL / ELT 機能に特化し、極限まで設定操作をシンプルに
  4. 主要なSaaS データの差分更新やCDC(Change Data Capture、変更データキャプチャ)のサポート
  5. フレキシブルなSQL / dbt 連携での取得データの変換

CData Sync では、1.データソースとしてShopify の接続を設定、2.同期先としてCSV の接続を設定、3.Shopify からCSV へのレプリケーションジョブの作成、という3つのステップだけでレプリケーション処理を作成可能です。以下に具体的な設定手順を説明します。

1.データソースとしてShopify の接続を設定

まずはじめに、CData Sync のブラウザ管理コンソールにログインします。CData Sync のインストールをまだ行っていない方は本記事の製品リンクからCData Sync をクリックして、30日の無償トライアルとしてCData Sync をインストールしてください。インストール後にCData Sync が起動して、ブラウザ設定画面が開きます。

それでは、データソース側にShopify を設定していきましょう。左の[接続]タブをクリックします。

  1. [+接続の追加]ボタンをクリックします。 コネクションの追加。
  2. [データソース]タブを選択して、リスト表示されるデータソースを選ぶか、検索バーにデータソース名を入力して、Shopify を見つけます。
  3. Shopify の右側の[→]をクリックして、Shopify アカウントへの接続画面を開きます。もし、Shopify のコネクタがデフォルトでCData Sync にインストールされていない場合には、ダウンロードアイコン(コネクタのアップロードアイコン)をクリックし、[ダウンロード]をクリックすると、CData Sync にコネクタがインストールされます。 データソースの追加。
  4. 接続プロパティにShopify に接続するアカウント情報を入力をします。

    それでは、Shopify への接続・認証について説明していきましょう。Shopify では、アクセストークンとOAuth の2つの接続方法をサポートしています。

    アクセストークンによる接続

    アクセストークン経由の接続には、以下の2つのステップが必要です。

    1. Shopify の管理画面でアクセストークンを作成
    2. アクセストークンを使用して認証

    アクセストークンの作成

    まず、アプリを登録してアクセストークンを取得してみましょう。手順は以下のとおりです。

    1. 管理画面からShopify にログインし、AppsApps and sales channels に進みます
    2. Develop apps をクリックしてCreate an app を選択します
    3. Overview タブのConfiguration で、Admin API integration をクリックし、アプリに許可するストアのアクセス権を選択してください。CData製品が必要とするAdmin API 権限については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「はじめに」セクションをご確認ください
    4. Save をクリックします
    5. Overview タブのConfiguration で、Storefront API integration をクリックし、アプリに許可するストアのアクセス権を選択します。CData製品が必要とするStorefront API 権限は以下のとおりです:
      • unauthenticated_read_content
    6. Save をクリックします
    7. API Credentials を選択します
    8. "Access tokens" の下でInstall app をクリックします。これでアクセストークンが作成されます
    9. Admin API Access token のアクセストークンをコピーします。注意:トークンの公開およびコピーは1回のみ可能ですので、必ず保存してください

    アクセストークンによる認証

    続いて、アクセストークンで認証するには、以下のプロパティを設定してください。

    • AuthSchemeAccessToken に設定
    • AccessToken:カスタムアプリからコピーしたアクセストークンの値に設定

    OAuth 認証を介した接続については、ヘルプドキュメントの「OAuth 認証の使用」をご確認ください。

    データソースの追加。
  5. [作成およびテスト]をクリックして、正しくShopify に接続できているかをテストして保存します。これでレプリケーションのデータソースとしてShopify への接続が設定されました。

2.同期先としてCSV の接続を設定

次に、Shopify のデータを書き込む先(=同期先)として、CSV を設定します。Sync では、CSV への同期には「Local File Storage」(ローカルのファイルストレージ)コネクタを利用します。Local File Storage コネクタは、CSV 以外にもAvro、Parquet のファイル形式に対応しています。

  1. [接続]タブを開いて、[+接続の追加]ボタンをクリックします。
  2. [同期先]タブを選択して、リスト表示されるデータソースを選ぶか、検索バーに「Local File Storage」と入力して、Local File Storage を見つけます。
  3. Local File Storage の右側の[→]をクリックして、Local File Storage の接続設定画面を開きます。もし、Local File Storage のコネクタがデフォルトでCData Sync にインストールされていない場合には、ダウンロードアイコン(コネクタのアップロードアイコン)をクリックし、[ダウンロード]をクリックすると、CData Sync にコネクタがインストールされます。 CSV を同期先に設定。
  4. 必要な接続プロパティを入力します。次のようにCSV ファイルを保存するディレクトリを指定します。
    • File Format: CSV を選択します。
    • URI: CSV ファイルの保存先に設定します。(
      C:/sync
      など)
    • Auth Scheme: None でOKです。

    Local File Storage の設定についてさらに詳しくは、ドキュメントをご確認ください。

  5. [作成およびテスト]をクリックして、正しく接続できているかをテストします。 同期先接続を確立。
  6. これで同期先としてCSV を設定できました。CData Sync では、同期するShopify に併せたカラム名を持つCSV ファイルを自動的に作成してくれます。もちろん、既存のファイルにマッピングを行いデータ同期を行うことも可能です。

3.Shopify からCSV へのレプリケーションジョブの作成

CData Sync では、レプリケーションをジョブ単位で設定します。ジョブは、Shopify からLocal File Storage という単位で設定し、複数のテーブルを含むことができます。レプリケーションジョブの設定には、[ジョブ]タブに進み、[+ジョブを追加]ボタンをクリックします。

ジョブの一覧

[ジョブを追加]画面が開き、以下を入力します:

  1. 名前:ジョブの名前
  2. データソース:ドロップダウンリストから先に設定したShopify を選択
  3. 同期先:先に設定したLocal File Storage を選択
ジョブの設定(Salesforce の例)。

すべてのオブジェクトをレプリケーションする場合

Shopify のすべてのオブジェクト / テーブルをレプリケーションするには、[種類]セクションで[すべて同期]を選択して、[タスクを追加]ボタンで確定します。

作成したジョブ画面で、右上の[▷実行]ボタンをクリックするだけで、全Shopify テーブルのCSV への同期を行うことができます。

オブジェクトを選択してレプリケーションする場合

Shopify から特定のオブジェクト / テーブルを選択してレプリケーションを行うことが可能です。[種類]セクションでは、[標準(個別設定)]を選んでください。

次に[ジョブ]画面で、[タスク]タブをクリックし、[タスクを追加]ボタンをクリックします。 ジョブへのタスク追加Salesforce の例)。

するとCData Sync で利用可能なオブジェクト / テーブルのリストが表示されるので、レプリケーションを行うオブジェクトにチェックを付けます(複数選択可)。[タスクを追加]ボタンで確定します。

タスク選択(Salesforce の例)。

作成したジョブ画面で、[▷実行]ボタンをクリックして(もしくは各タスク毎の実行ボタンを押して)、レプリケーションジョブを実行します。 作成したジョブの実行(Salesforce の例)。

このようにとても簡単にShopify からCSV への同期を行うことができました。

CData Sync の主要な機能を試してみる:スケジューリング・差分更新・ETL

ジョブのスケジュール起動設定

CData Sync では、同期ジョブを1日に1回や15分に1回などのスケジュール起動をすることができます。ジョブ画面の[概要]タブから[スケジュール]パネルを選び、[⚙設定]ボタンをクリックします。[間隔]と同期時間の[毎時何分]を設定し、[保存]を押して設定を完了します。これでCData Sync が同期ジョブをスケジュール実行してくれます。ユーザーはダッシュボードで同期ジョブの状態をチェックするだけです。 スケジュール実行設定。

差分更新

CData Sync では、主要なデータソースでは、差分更新が可能です。差分更新では、最後のジョブ実行時からデータソース側でデータの追加・変更があったデータだけを同期するので、レプリケーションのクエリ・通信のコストを圧倒的に抑えることが可能です。

差分更新を有効化するには、ジョブの[概要]タブから「差分更新」パネルを選び、[⚙設定]ボタンをクリックします。[開始日]と[レプリケーション間隔]を設定して、[保存]します。

SQL での取得データのカスタマイズ

CData Sync は、デフォルトではShopify のオブジェクト / テーブルをそのままCSV に複製しますが、ここにSQL、またはdbt 連携でのETL 処理を組み込むことができます。テーブルカラムが多すぎる場合や、データ管理の観点から一部のカラムだけをレプリケーションしたり、さらにデータの絞り込み(フィルタリング)をしたデータだけをレプリケーションすることが可能です。

ジョブの[概要]タブ、[タスク]タブへと進みます。選択されたタスク(テーブル)の[▶]の左側のメニューをクリックし、[編集]を選びます。タスクの編集画面が開きます。

UI からカラムを選択する場合には、[カラム]タブから[マッピング編集]をクリックします。レプリケーションで使用しないカラムからチェックを外します。

SQL を記述して、フィルタリングなどのカスタマイズを行うには、[クエリ]タブをクリックし、REPLICATE [テーブル名]の後に標準SQL でフィルタリングを行います。 レプリケーションのカスタマイズ設定。

Shopify からCSV へのデータ同期には、ぜひCData Sync をご利用ください

このようにノーコードで簡単にShopify のデータをCSV にレプリケーションできます。データ分析、AI やノーコードツールからのデータ利用などさまざまな用途でCData Sync をご利用いただけます。30日の無償トライアルで、シンプルでパワフルなデータパイプラインを体感してください。

日本のユーザー向けにCData Sync は、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

CData Sync の 導入事例を併せてご覧ください。

はじめる準備はできましたか?

詳細はこちら、または無料トライアルにお申し込みください:

CData Sync お問い合わせ