Apache Spark でFreshdesk のデータをSQL で操作する方法

杉本和也
杉本和也
リードエンジニア
CData JDBC ドライバーを使用して、Apache Spark でFreshdesk にデータ連携。

Apache Spark は大規模データ処理のための高速エンジンです。CData JDBC Driver for FreshDesk と組み合わせると、Spark はリアルタイムでFreshdesk のデータに連携して処理ができます。本記事では、Spark シェルに接続してFreshdesk をクエリする方法について解説します。

CData JDBC Driver は、最適化されたデータ処理がドライバーに組み込まれているため、リアルタイムFreshdesk と対話するための高いパフォーマンスを提供します。Freshdesk に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計など、サポートされているSQL操作を直接Freshdesk にプッシュし、組込みSQL エンジンを使用してサポートされていない操作(SQL 関数やJOIN 操作)をクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータ型を使用してFreshdesk を操作して分析できます。

CData JDBC Driver for FreshDesk をインストール

まずは、本記事右側のサイドバーからFreshDesk JDBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

Spark Shell を起動してFreshdesk のデータに接続

  1. ターミナルを開き、Spark shell でCData JDBC Driver for FreshDesk JAR file をjars パラメータに設定します:
    $ spark-shell --jars /CData/CData JDBC Driver for FreshDesk/lib/cdata.jdbc.freshdesk.jar
    
  2. Shell でJDBC URL を使ってFreshdesk に接続し、SQL Context load() function でテーブルを読み込みます。

    FreshDesk はbasic 認証を使用します。データへの接続には、次の接続プロパティを設定してください。

    • Domain:この値を、FreshDesk アカウントに紐づけられたドメインに設定します。例えば、 https://my_domain.freshdesk.comです。
    • APIKey:この値を、FreshDesk アカウントに紐づけられたAPI キーに設定します。API キーを取得するには、 サポートPortal にログインして、-> 右上端のプロファイル写真をクリック、-> プロファイル設定ページに移動します。API キーは、 右のchange password セクションの下から生成できます。

    組み込みの接続文字列デザイナー

    JDBC 接続文字列URL の作成には、Freshdesk JDBC Driver にビルトインされたデザイナを使用できます。JAR ファイルをダブルクリックするか、コマンドラインでJAR ファイルを実行するとデザイナが開きます。

    java -jar cdata.jdbc.freshdesk.jar
    

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    scala> val freshdesk_df = spark.sqlContext.read.format("jdbc").option("url", "jdbc:freshdesk:Domain=MyDomain;APIKey=myAPIKey;").option("dbtable","Tickets").option("driver","cdata.jdbc.freshdesk.FreshDeskDriver").load()
    
  3. 接続が完了し、データがロードされたら、テーブルスキーマが表示されます。
  4. Freshdesk をテンポラリーテーブルとして登録します:

    scala> freshdesk_df.registerTable("tickets")
  5. データに対して、次のようなカスタムSQL クエリを実行します。

    scala> freshdesk_df.sqlContext.sql("SELECT Id, Name FROM Tickets WHERE Status = 2").collect.foreach(println)

    コンソールで、次のようなFreshdesk のデータを取得できました!これでFreshdesk との連携は完了です。

    Freshdesk をApache Spark から取得

CData JDBC Driver for FreshDesk をApache Spark で使って、Freshdesk に対して、複雑かつハイパフォーマンスなクエリを実行できます。30日の無償評価版 をダウンロードしてぜひお試しください。

Apache Spark の設定

はじめる準備はできましたか?

Freshdesk Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Freshdesk Icon Freshdesk JDBC Driver お問い合わせ

Freshdesk に連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。