回帰分析とは?(回帰分析の定義と役割について)
回帰分析とは、統計学において、1つの変数(目的変数)を他の変数(説明変数)との間の関係式で表すことで、変数間の関係を分析する方法の1つです。
何かを行ったこと(説明変数)がある結果(被説明変数)に対してどのような影響を及ぼしたか。この説明変数と被説明変数の因果関係を、関数を使って分析する手法のことを意味します。
なお、回帰分析は、因果関係の推定、あるいは予測を目的に行われるのが一般的です。このうち推定については、ある広告キャンペーンを行ったことでどれだけ売上が増加したかなど、ある変数間の関係性を明らかにするために行われます。
一方で、予測を目的に行われる回帰分析では、手元にあるデータをもとに回帰式をまず推定で作ります。
たとえば、過去のデータから広告宣伝費と売上の回帰式を推定したり、予算を作った式に代入して売上の推定値を導出するなどの使われ方が、代表的な推定式の回帰分析です。これにより、得られる結果の推定値を算出します。
ビジネスの現場では推定・予測の両方の目的で回帰分析が使われますが、特に多いのは推定です。
すでに手元にあるデータをもとに、それらの因果関係を見極めるために回帰分析が行われることが多くなっています。
これは、効果を期待して行った施策が本当に意図通りの結果をもたらしていたのかなどが明確化でき、問に対して因果関係に基づいた意思決定を行えるようになるためです。
単回帰分析と重回帰分析とは?(単回帰分析と重回帰分析の違いについて)
回帰分析にはさまざまな種類がありますが、ひとつの切り口として、「単回帰分析」と「重回帰分析」の2つに分類することができます。
このうち単回帰分析というのは、1つの変数によって予測値や因果関係を導き出す分析手法で、1つの要素が目的変数に与える影響を分析する方法です。
一方で、重回帰分析というのは、その名の通り2つ以上の変数を使って予測値や因果関係を導く分析手法のことで、目的変数が1つで、説明変数が2つ以上ある場合の回帰分析の手法です。
両者はよく似てはいるものの、単回帰分析に対して重回帰分析は、一気に複雑さが増す点には注意が必要です。たとえば、家賃が決まる決定要因を使って単回帰分析と重回帰分析を行うと、イメージしやすいです。
一般的にxで表される予測値や因果関係を説明する説明変数を「駅からの距離」とし、yで表されることが多い説明変数によって決定される被説明変数を「家賃」とした場合、単回帰分析です。一方で、この説明変数を「駅からの距離」に加えて「築年数」などのほかの要素を加えて式を作る場合、重回帰分析となります。
なお、実際の分析を行う際にはこれらをすべて数値化します。説明変数と被説明変数には違う単位が使われていることも多いですが、得たデータを近似的に数式化し傾向を理解するのが目的です。そこにこだわる必要はありません。
回帰分析の手順(回帰分析を行うための手順、要素選択やデータ収集などについて)
回帰分析を行うには、まず被説明変数を決める必要があります。なお、この被説明変数は目的変数や応答変数、従属変数と呼ばれることもある、予測や要因を分析したい数値のことです。お店であれば売上や利益、来店客数などが該当します。
分析を行いたい被説明変数を決めたら、被説明変数に影響を与えていそうな説明変数を抽出します。単回帰分析を行いたい場合一番影響を及ぼしていそうな1つに絞る必要があります。一方で、重回帰分析をする場合複数の要素をあげれば良いものの、その分だけ解析が複雑化します。お店であれば席数や通行量、最寄り駅までの距離などが使えます。
また、これら変数と並行してすべきなのが、分析に必要なデータの準備です。それぞれに説明変数と被説明変数の値を持つデータの準備を行います。この際、準備するデータ数が多いほど正確性の高い分析が行えるので、できるだけ多くのデータを集める必要があります。
そして、説明変数・被説明変数・データという回帰分析に必要な3つの要素の準備が済んだら、あとは実際に回帰式を作るだけです。説明変数と被説明変数の変化をできるだけ正確に表す式を作ることが重要です。難しく思える最も重要な部分ですが、Excelなどのツールを使えば簡単に最適な回帰式を求められます。
回帰分析の注意点(回帰分析の限界や適合適合の問題について)
このように回帰分析を行うと、統計的に根拠のある結論を得ることができます。そのため、製造現場やマーケティング業界など、さまざまなビジネスの現場で広く回帰分析は使われています。
ただ、回帰分析で使った説明変数が完璧とは限りません。気づいていないだけで被説明変数に影響を与えられている因子が他にある可能性はゼロではありません。
分析に使った全データに対して非常に整合性の高い式ができていたとしても、抜け落ちている要素がある可能性があります。すべての要素を考慮していない回帰式を使っている限り、予測やシミュレーションには現実との齟齬がどこかで必ず生じます。
また、重回帰分析で説明変数同士が影響を及ぼすケースも少なくありません。この場合、被説明変数を正しく求めることは回帰分析ではできません。むやみやたらに説明変数を増やしても意味がなく、組み合わせや使う説明変数を慎重に精査することも必要です。
さらに、重回帰分析を中心に、概念や計算処理が複雑化しやすい点にも注意が必要です。
Excelなどのツールに複雑な計算自体は任せることはできるものの、分析内容を理解していない限り適切な解釈や予測ができません。知識や技術をもった上で行うべき分析手法でもあります。