マーケティング・リサーチ 重回帰分析とは
重回帰分析とは統計的手法の一つで、ある数量がどのような要素により成り立っているかを調べるためのものです。近年はAIやコンピューター技術の発達によりビッグデータを扱うことが比較的容易になり、ビジネスでのマーケティング戦略にもこうした分析が頻繁に用いられるようになってきました。重回帰分析の原理を理解しておくことで、より説得力のあるデータ解説が可能になり、効率よく業務に役立てることができます。
回帰分析とはある変数Yを他の変数Xを用いて表すための統計的手法の一つです。その中でも、重回帰分析とは2つ以上の説明変数を用いて目的変数を予測、説明しようとするものです。回帰式を求めることによって将来目的変数がどう変化していくのかを予測したり、目的変数に最も強い影響を与えている要因(説明変数)がなんであるのかを推定したりすることができます。またその予測がどのくらいの精度のものであるかを調べることもできます。回帰分析というと難しく聞こえますが行う計算自体は分散の組み合わせであり、エクセルで計算をすることも可能です。
例えばある店の売上について考えてみましょう。売上に影響する要因(説明変数)には接客、立地、品揃え、売り場面積等があると考えられます。重回帰分析を用いることで売上という目的変数をこれら4つの説明変数の和とそれぞれの係数の形で表すことができます。したがって、説明変数の部分に数値を代入することで様々な状況での売上を予測することができるようになります。また、さらに分析を行うことでどの説明変数が最も強く売上に影響を与えているのかを推定できるようになるため、販売戦略の改善に役立てることができます。近年はビッグデータを元にこうした分析を行い、マーケティングに役立てるということがよく行われています。
1つの目的変数を複数の説明変数で予測するためのものが重回帰分析です。式で表すと、Y = a1X1 + a2X2 + a3X3 + … + a0(Y=目的変数,an = 定数, Xn = 説明変数)という形になります。この式のことを重回帰式と呼びます。XとYに当てはめるためのデータを抽出し、重回帰分析によって定数anの値を求めるという手順になります。ここで注意しておかなければならないのが各説明変数は互いに独立したものでなければならないという点です。例えば、体重という目的変数を説明するために身長、腕の長さ、体脂肪率という3つの変数を設定したとしましょう。この3つの変数のうち、身長と腕の長さには強い相関があると言われています。このような場合、3つの未知数に対して扱える変数が2つしかないという状況になり、安定した推定値を得ることができません。これを多重共線性(multicollinearity)といいます。
多重共線性が発生してしまうと正しい推定値が得られなくなってしまうため、説明変数を設定する段階で気をつける必要があります。また、多重共線性が疑われるときはさらに別の分析を実施して検証し、互いに相関関係が高いと考えられる場合は原因となる説明変数を外して計算を行う必要があります。
重回帰分析をビジネスの現場で利用するには、まず目的変数となるものを設定しなければなりません。目的変数となりうるものは売上や営業成績、店舗への来店者数等様々なものが考えられます。売上を予測したいのか、来店者数に影響を与えるものを調べて店舗環境を改善したいのかといったように、ゴールにあわせて適切な目的変数を設定しなければいけません。次に説明変数としてどのデータを抽出するか選びます。上述のとおり、多重共線性に注意し互いに独立している変数を選ぶ必要がありますし、多すぎる要素を設定してしまった場合良い分析結果を得ることはできません。同時に、取り入れる変数が少なすぎると実際起こっている影響とモデルとの間の乖離が大きくなり、目的となる変数を上手く説明することができません。ある程度予測の正確さを担保するためには説明変数の数も重要になってくるということです。
重回帰分析はビジネスの他に生態学や社会学などのアカデミックな分野でも用いられますが、7つ程度の要素数に収めている場合が多いようです。また、説明変数の種類によっては数字のデータに上手く落とし込むことが難しいケースもあります。この場合は数量化1類等といった別の多変量解析の手法を用いることで重回帰分析と同じような予測結果を得ることができます。
重回帰分析を用いてできることは大きく分けて2つあります。ある数量が将来どのように変化するか予測することと、その数量の変化にどの要素がどの程度寄与しているかを調べることです。売上に接客や立地等といった要素が影響することは直感的にも理解できますが、重回帰分析を用いて数式化することで実際に影響を与えているということを視覚的に表現することができます。また、解析によって得られた式から算出される予測値は統計に基づいたものとなるため、プレゼンテーション資料等で用いることができればより説得力が増します。
また、将来の予測とは逆である目標値を設定し、その目標を達成するために各要素の数値をどのくらい変化させればよいのかを逆算することもできます。例えば売上の目標値を設定し、その目標値に推移させるために売り場面積や品揃えなどの要素をどこまで変化させればよいか逆算するというような具合です。これにより、統計的な根拠に基づいた達成目標を設定することができます。さらに、各要素がどのくらいの強度で目的変数に寄与している(影響を与えている)かを検証することもできるため、どの要素を改善すれば効率よく目的となる数値を改善することができるかを決定することもできます。この要素の寄与率というのは分析するデータによって変わりうるため、調査する対象が変われば寄与率も変化します。したがって、複数店舗の売上を改善したいような場合はそれぞれの店舗を対象に分析を行う必要があります。
実はこうした分析は現在AIなどに任せて自動で行うことができるようになってきており、自分の手で分析を行う場面はそれほど多くないかもしれません。しかし、算出されたデータを扱うのはあくまで人間であり、計算の原理を理解しておかなければ上手くデータを活用することができません。重回帰分析などの統計的手法についての理解を深めればデータに基づいて発言の説得力が高まり、合理的な業務の遂行に役立てることができます。