【データの活用】データ活用の3つの方法
2024/01/28 更新
データ活用の3つの方法
(1データの活用には、以下3つの方法があります。
(2)それぞれに長所・短所があり、使い分けることが必要です。
指標のグラフ化
(1)取得したデータをグラフ化して単純に見比べる方法です、
(2)運営状況に異常がないかをチェックすることができます。データから、直感的に予想を立てるのに役立ちます。
(3)データを加工せずに利用するために、簡便です。
(4)データからの予想の読み取りは、結局、分析者のカンに頼るところがあります。
回帰分析
(1)回帰分析(重回帰分析)は、3種類、4種類のデータを使って予想モデルを作るものです。
(2)例えば、賃料を予想するのであれば、「駅からの距離」、「建築されてからの年数」等のデータを入力します。
イメージで言えば、Ⅹ軸に「地価」、Y軸に、「駅からの距離」、Z軸に、「家賃」を入力して点を打っていきます。そして、その点が密集している固まりに線を引いて、仮説の計算式を作るようなイメージです。
賃料=40.969×「駅からの距離」+0.5978×「建築されてからの年数」という計算式ができます。
(3)回帰分析等では、いろいろなデータ(変数)を入力することはできません。それぞれの変数が独立していることが必要です。変数の相関関係が強い(依存関係がある変数がある)と、予測結果が不安定になり、変数をしぼる必要があります(多重共線性)。
(4)回帰分析は、ビジネスにとって活用しやすい分析方法です。機械学習ほど、データ数が不要です。変数(結果に影響力の高い数字)を予想して、トライアンドエラーで成果を測定し、予想モデルの上げていきます。仮説と検証がビジネスでの思考と類似性が高いです。
(5)回帰分析は、AI(機械学習)と比べて、使える変数が少ない入力データの選定という過程があり、分析者のカンに頼るところがあるところです。一般論として、回帰分析の予測精度は、AI(機械学習)に劣ります。
機械学習
(1)機械学習は、膨大なデータを学習し、分類方法や予測を出す方法を自動的に構築するものです。
(2)機械学習には、膨大なデータを分析し判断します。人が介入せずとも結論を出せます。機械学習の予想精度は、高レベルを期待できます。
(3)機械学習には、膨大なデータを用意しなければ活用できない、という欠点があります。
(4)基本的に、機械学習がなぜその判断をしたのかは分かりません。どの変数が、結果に強い影響力を及ぼすのか、どの点に注力すればよいのか回答してくれば、トライアンドエラーで精度を上げていくビジネスには使いにくいところがあります。
参考
ハーバードビジネス レビュー2024年1月号32頁以下