【データの活用】回帰分析
2024/01/28 更新
回帰分析
(1)回帰分析(重回帰分析)は、3種類、4種類のデータを使って予想モデルを作るものです。
(2)例えば、賃料を予想するのであれば、「駅からの距離」、「建築されてからの年数」等のデータを入力します。
イメージで言えば、Ⅹ軸に「地価」、Y軸に、「駅からの距離」、Z軸に、「家賃」を入力して点を打っていきます。そして、その点が密集している固まりに線を引いて、仮説の計算式を作るようなイメージです。
賃料=40.969×「駅からの距離」+0.5978×「建築されてからの年数」という計算式ができます。
外れ値の撤去
(1)外れ値は、何らかの理由で、他の結果と異なった数字です。これを除去しなければ、回直直線が移動してしまいます。
(2)これらの数字(値)を除去する必要があります。
多重共通性のチェック
(1)回帰分析等では、いろいろなデータ(変数)を入力することはできません。それぞれの変数が独立していることが必要です。変数の相関関係が強い(依存関係がある変数がある)と、予測結果が不安定になり、変数をしぼる必要があります(多重共線性)。
(2)各変数について、相関関係がないかをチェックして判断します。
予想精度と実際の対応
(1)回帰分析についても、あくまで予想であるので、齟齬ができます。
(2)これをどうするか、見当が必要です。
例えば、予想値は〇だが、少し多めに購入するなど、バッファーを設ける必要があります。
エクセルと回帰分析
(1)エクセルを使えば回帰分析を計算することができます。
(2)インターネットや書籍でも回帰分析の方法が紹介されています。
ビジネスと回帰分析
(1)回帰分析は、ビジネスにとって活用しやすい分析方法です。機械学習ほど、データ数が不要です。変数(結果に影響力の高い数字)を予想して、トライアンドエラーで成果を測定し、予想モデルの上げていきます。仮説と検証がビジネスでの思考と類似性が高いです。
(2)回帰分析は、AI(機械学習)と比べて、使える変数が少ない入力データの選定という過程があり、分析者のカンに頼るところがあるところです。一般論として、回帰分析の予測精度は、AI(機械学習)に劣ります。