BIのキューブとは?基礎からわかる概要・役割と必要性
BIにおいてキューブってどういう概念
BIのキューブとデータマートって何が違うのかな
BIのキューブはどうやって設計するのがよいものなんだろう
BIツールの活用を進める上で重要な概念が「キューブ(cube)」です。
本記事では、世界50ヶ国以上、約29,000社以上で採用されるBIツールを展開するYellowfinが、BIツールのキューブについて詳しく解説します
はじめに、BIツールにおけるキューブの概念をご紹介していきます。
キューブとは、BIの機能の一つで、深い分析をするため使う様々な切り口で分析できるようにするデータベース群のことです。
一般的に使われるエクセルでは表計算といわれるように、縦と横の2次元でクロスして面で分析します。
BIでは、縦・横の面による2次元だけではなく、奥ゆきとなる3次元以降の多次元の切り口を加えて、より深い分析を行うため立方体を意味する「キューブ」という言葉が利用されています。
キューブによる分析は、多次元データ分析と呼ばれています。
キューブを活用するメリットとしては、ビッグデータの分析を短時間で処理することができることが挙げられます。
逆に、デメリットを挙げるなら、どういった分析をしたいのか、設計を行う必要があり、しっかりと活用をするためには一定の専門性が必要となります。
BIのキューブはデータマートの一種
次に、BIのキューブを語る上でよく利用される「データマート」という言葉との違いと概念の位置付けについて解説します。
データマートとは、会社全体のデータであるDWH(データウェアハウス)から、目的にあわせて一部分だけを切り出したデータベースのことを指します。
データマートは、「目的に合わせて切り出したデータベースそのもの」であり、キューブは「データベースからデータを切り出す方式」のことです。
企業の必要としているデータマートを用意するために、多次元データ分析ができる「キューブ」というデータベース群を活用する、という関係性です。
そのため、キューブもデータマートの一種であると言えます。
BIツールのキューブは設計が重要
BIで多次元データ分析を活用するためには、キューブの設計がポイントになります。
ここではBI初心者向けに、キューブを設計するために知っておくべき基礎知識と、キューブを設計するというのはどういうことなのか、を紹介します。
基礎知識としてのディメンションとメジャー
キューブを設計する上で、知っておくべきキーワードが「ディメンション」と「メジャー」です。
ディメンションとは、データを分析する切り口のことです。
メジャーとは、分析する対象そのものことです。
立方体を意味する「キューブ」は、情報を見る切り口としての「ディメンション」の組み合わせによって「メジャー」を分析します。
ディメンションによって多次元データ分析を可能にするキューブですが、データ分析を行っていく上で必要になるのが「設計」です。
多次元データ分析は、エクセルなどでの分析に加えて複雑なため、設計を蔑ろにしてしまうと、結果的に必要なレポートが得られないという状況になってしまいます。
キューブを設計するというのはどういうことか
多次元データ分析を行うにあたって、キューブの設計を行います。
実際にキューブを設計するのために行うことは、以下です。
・設定するディメンションの決定
・利用するデータの確認と整備
・出力画面のレイアウト決定
それぞれ簡単に説明します。
設定するディメンションの決定
多次元データ分析をする際の切り口となるディメンションの種類を階層構造を決めます。
ディメンションの構成によって、分析できる範囲や深さが決まるため、キューブ設計の最も重要な部分だと言えます。
利用するデータの確認と整備
もう1つポイントとなるのが、利用するデータの確認と整備です。
分析をするためのデータの整合性を整えておく必要があります。
例えば、新しいプロダクトが販売された場合に、そのデータが欠損していると、全体を俯瞰して理解できるなくなってしまいます。
出力画面のレイアウト決定
最終的にどういった分析レポートに仕上げるのか、出力画面のレイアウトを決めます
目的としていた分析結果が、定型のレポート出力で確認しにくい場合は、利用者の視点に立って見やすい表示項目やグラフの活用などが必要になります。
関連記事:BIツールを総まとめ!概要や機能からメリット・デメリットまでプロが徹底解説
まとめ
本記事では、BIのキューブについて解説をしました。
キューブとは、色々な切り口でデータを分析できるようにしたデータベース群のことでした。
多次元データ分析をする上で欠かせないのがキューブであり、しっかり活用するためには設計に配慮することが大切です。
近年は高速なDHWプロダクトがクラウド環境で気軽(安価)に使えるようになったことや、BIツール自体の機能の進化、またキューブの構築自体の手間にも課題があり、キューブを利用したBIの環境は殆ど見られなくなっています。
どのような技術を採用するのかは、運用に入った後のコストも含めて検討する必要があります。