複数のデータの関連性を分析する多変量解析の意味から実施手順までを解説
複数のデータの関連性を分析したい
多変量解析の分析手法を知りたい
多変量解析の手順を整理したい
昨今、多くのビジネスシーンでデータの分析・活用が進んでいます。データを使いこなせれば、以下のとおり様々なメリットがあります。
- 根拠に基づいた正確な対策を打ち出せる
- 客観的かつスピーディーに意思決定
- 高い精度で未来予測
しかし、実際には様々がデータ同士が複雑に関係し合っていることも少なくありません。それらのデータの関係性を明らかにできれば、一層ビジネスにデータを活用できます。その時に有効な手法が多変量解析です。
この記事では、多変量解析の意味・目的・データの種類・主な分析手法・手順を紹介します。
多変量解析とは、複数の変数に関するデータから、変数間の関連性を分析する統計的技法の総称のことです。多変量解析には重回帰分析やクラスター分析などの分析手法が含まれますが、特定の分析方法を指すものではありません。
多変量解析では、複数のデータの関連性を分析して、以下のとおり様々なことができます。
- アンケート結果から商品の強みや弱みを分析する
- 既存店舗の売上や顧客データから新店舗の将来の売上を予測する
多変量解析で複数のデータの関連性を分析する2つの目的
ここでは、多変量解析の目的を紹介します。
- 予測
- 要約
それでは1つずつ紹介します。
予測
多変量解析の目的の1つ目は、予測です。
複数の変数から何らかの結果を予測するものです。因果関係明確化の手法とも言えます。これにより、どの原因からほしい結果が得られるか知ることができます。
原因側のデータを「説明変数」(もしくは「独立変数」)と言い、結果側の変数を「目的変数」(もしくは「従属変数」)と言います。予測の手法では、説明変数と目的変数をわけなければなりません。また、同じ変数が説明変数にも目的変数にもなり得ます。
(例)
身長から体重を予測。胸囲や食生活などの変数を加えればより正確な予測になる。
要約
多変量解析の目的の2つ目は、要約です。
複数の変数を新しい変数に要約するものです。これにより多くの変数を少ない変数で説明しようとするもので、類似関係明確化の手法と言います。
予測の手法には目的変数がありますが、要約の手法には目的関数はありません。ただ、因果関係がわかれば説明変数と目的変数にわけることができます。
(例)
国語、英語、数学、理科、社会の5教科を、文系(国語、英語、社会が該当)、理系(数学、理科が該当)に要約。
複数データの分析で用いるデータの種類
ここでは、多変量解析で用いるデータの種類を紹介します。
- 量的データ
- 質的データ
それでは1つずつ紹介します。
量的データ
多変量解析で用いるデータの種類の1つ目は、量的データです。
数値で表せるデータのことで、「数量データ」、「定量データ」とも言います。量的データは、以下の2つに分類できます。
質的データ
多変量解析で用いるデータの種類の1つ目は、質的データです。
数値で表せないデータのことで、「定性データ」、「カテゴリーデータ」とも言います。質的データは、以下の2つに分類できます。
複数データの関係性を分析する主な分析手法
多変量解析には、様々な分析手法があります。ここでは、目的変数・説明変数ごとに区分して代表的な分析方法を1つずつ紹介します。
・重回帰分析:複数の量的な説明変数から1つの量的な目的変数を予測。多変量解析の中でも最も使われることの多い分析手法。
(例)スーパーマーケットにおいて、来店者数や気温、広告費などの変数から、ビールの売上はどの変数の影響を大きく受けるか分析。将来の数値や他店舗での数値を予測できる。
・判別分析:複数の量的変数から質的変数を予測してグループ分け
(例)携帯電話の契約中のユーザーについて、支払金額、使用量、契約年数などから継続/解約を予測。
・主成分分析:複数の量的変数を、より少数の主成分という指標(合成変数)に要約
(例)自社商品の満足度調査として、使い心地や顧客対応などについて顧客に5段階評価のアンケートを行い、総合的な満足度を分析。
・数量化Ⅰ類:重回帰分析と同じような考え方で、質的変数から量的変数を予測。
(例)性別、飲酒の有無、喫煙の有無、運動の有無などの質的データを間隔尺度に変換して、「癌になる確率」を予測
・数量化Ⅱ類:判別分析と同じような考え方で、質的変数から質的変数を予測。
(例)性別、飲酒の有無、喫煙の有無、運動の有無などの質的データを間隔尺度に変換して、「癌になる/癌にならない」を予測
・数量化Ⅲ類:主成分分析と似た手法で、複数の質的変数を少数の変数に要約。
(例)顧客へのアンケート調査の結果を基に、質問や顧客の間での類似度を得点化してポジショニングマップを作成
複数データの関係性を分析する手順
ここでは、多変量解析の手順を紹介します。
・必要なデータを収集
・目的の明確化と仮説立て
それでは1つずつ紹介します。
必要なデータを収集
多変量解析の手順の1つ目は、必要なデータを収集することです。
多変量解析に限らず、データ分析には一定以上のサンプル数(データ量)を集める必要があります。分析手法や分析目的によって必要なデータは異なってきますので、必要なデータを必要なサンプル数だけ収集しましょう。
また、収集したデータの中に不明瞭なデータも混ざっているかもしれません。データを選択して、多変量解析には不適なデータを取り除くことで、より分析の精度が向上します。
目的の明確化と仮説立て
多変量解析の手順の3つ目は、目的の明確化と仮説立てです。多変量解析にも様々なアプローチが存在します。多変量解析を行う前に以下のプロセスを踏むことで、正しい分析手法を選択して分析結果をよりビジネスに活用できることでしょう。
- 目標の明確化:現状とその課題を十分に把握し、データ分析を行う目的を明確化。また、多変量解析のゴールを設定。
- 仮説立て:現状とその課題から仮説を立てて、その仮説が自社のビジネスで成り立っているか検証することがデータ分析の目的。目標と仮説両方そろって初めて、意味のある多変量解析を行える。
まとめ
この記事では、多変量解析の意味・目的・データの種類・主な分析手法・手順を紹介しました。
昨今、情報システムが発達して誰でも大量のデータを取り扱えるようになっています。しかし、その分個々のデータの価値は小さくなっているため、データを適切に分析してそれぞれの関係性を見極める必要があります。それには多変量解析は有効な手法です。
ただ、多変量解析でビジネスに活用できる知見を得るには、適切なデータを収集して、適切な手法で分析する必要があります。また、その前段で現状把握や目標設定を行い、多変量解析のゴールや検証したい仮説を明確にしておく必要があります。
多変量解析を行う目的を明確にして、多変量解析の結果を活かしてビジネスを改善していきましょう。