BIツールでのデータ分析にデータベースは必要か?|DB/DWHがあった方が便利な3つのパターン

by 出村さやか | May 9, 2025

1

TableauやPower BIといったBIツールでデータ分析を検討していると「DB(データベース)」や「DWH(データウェアハウス)」を用いる以下のような構成を示されることがあるかと思います。

2

ですが、BIツールを使う際に必ずしもDBやDWHをセットで考える必要はありません。

BIツールとデータソース

BIツールを利用するとさまざまなデータを難しい操作は抜きにいろんな切り口で分析、可視化することができます。

この「さまざまなデータ」はどこにあるのかというと、普段利用しているSaaSやCSV、Excelファイルなどの「データソース」にあります。

3

BIツールとデータソースの両者をつなぐ方法としては、まず直接接続する方法があります。

4

主要なデータソースについてはBIツール側で「XXへ接続」といった形で接続メニューが用意されていることが多いです。

(例)Power BI Desktopの場合

5

上記のような接続メニューが標準で用意されていない場合も、弊社のDrivers & Connectorsの利用でBIツールとデータソースを直接接続することが可能です。

(例)Power BI Desktopの場合

6

以上のとおりBIツールとデータソースは直接接続することが可能なのですが、直接接続可能な場合であっても以下のようなDB/DWHを間に挟む構成を示されることがあります。

7

この構成は、何らかの方法でデータソースのデータをDB/DWHへ複製(コピー)し、BIツールはDB/DWH上の複製データを用いる、という形になります。

直接接続できるのに、どうしてわざわざDB/DWHを用意し、データを複製する、といった手間をかける必要があるのでしょうか?

DB/DWHがあった方が便利な3つのパターン

BIツールとデータソースの間にDB/DWHがあった方が便利なパターンの例としては以下があげられます。

パターン1.データソースに負荷をかけたく無い場合

データソースとBIツールを直接接続する方法はBIツール側からすると比較的手間もかからず便利な方法なのですが、データソースとなるシステム側からすると負荷のかかる方法です。なぜなら、データアクセスがシステムの入力画面とBIツールの両方から行われるためです。

8

システムに負荷がかかると入力画面を使っている人も、BIツールを使っている人も、実行した操作=データの取得や更新がなかなか終了せず、作業効率や生産性の低下などにつながっていく恐れがあります。

システムの負荷が気になるときはDB/DWHを間に挟む構成をとり、かつデータソースからDB/DWHへのデータ複製についても1回目のデータ複製以降は追加・変更のあったデータのみを対象にデータ複製を行う差分更新の仕組みを活用することで、システムの負荷を抑えつつも、フレッシュなデータでデータの可視化や分析を行うことが可能です。

9

ちなみに、弊社製品の場合ですとCData Syncを利用することで差分更新を用いたデータ複製を検討いただけます。

視聴だけでも参加可能なCData Syncハンズオンセミナーを毎月開催しておりますので、CData Syncについて知りたいという方はぜひご参加ください!

パターン2.データソースのデータ量が膨大な場合

例えばマーケティングツールのような、毎分毎秒新しいデータがどんどん登録されていくようなデータソースの場合、直接接続する方法ですとデータ量が膨大な分、データの取得に時間がかかるのはもちろんなのですが、データソースのデータを抽出(インポート)してBIツール側で持つ場合BIツール側にそれなりの容量がもとめられます。

抽出するのではなくレポート等を開くたびに都度データソースにデータを取得しにいく場合(Direct Queryやライブ接続などと呼ばれる方法の場合)取得に時間がかかる + (大量のデータをBIツールに渡す処理が走るので)データソースに負荷をかけることになります。

そのため、データソースのデータ量が膨大な場合にも、パターン1と同様に差分更新を利用してデータソースになるべく負荷をかけない形でDB/DWHにデータを複製し、といった構成の方がフィット感が高いことが多いです。

ちなみに、データソースがSaaSなどの場合、BIツールは(内部的には)SaaS側に用意されているAPIを通してデータを取得するのですが、一般的にAPIアクセスよりDB/DWHアクセスの方が高速ですので(特に取得したいデータ量が膨大場合には)直接接続よりもDB/DWH上の複製データを利用する方がBIツールからのデータ取得パフォーマンスが高いです。

パターン3.履歴を保存したい場合

データソースが持つデータの中には、日々値が変わっていくものがあります。

例えば、顧客ランク。今月まではランクBだった顧客が(何らかの理由で)翌月にはランクAになる、といったことが起こり得ます。

直接接続している場合、BIツール側には今月はB、翌月はAと表示されるのみで、ある顧客のランクが変化したのかどうかやランクの変遷を確認することはかないません。

10

もし顧客ランクの変化をBIツール側で確認したい場合は、DB/DWHを間に挟む + ある時点のデータ(スナップショット)をDB/DWHに保存する(DB/DWHに履歴を保存する)という構成がマッチします(あるいはBIツール側である時点のデータを毎月抽出して、ファイルを分けて保存しておく方法もあるかと思います)。

11

まとめ

BIツールとデータソースの間にDB/DWHがあった方が便利なパターンを3つご紹介しましたが「この場合は必要?不要?」などございましたらお問い合わせフォームからお気軽におたずねください。

ご利用(ご検討)のデータソースとBIツールの組合せを踏まえ、最適な方法をご案内いたします!