データ分析でお得な物件を探したい part.2
物件の分析の前にもう少し。
データ見直し
前回、地価をそのままプロットして、アチャー(ノ∀`)となったので、少し改良しましょう。
まず、飛び抜けて地価が高いところを調べると、住宅街ではなくて商業地用の土地とかでした。さすがにそれはのけておきます。
さらに住宅地でもあまりにも値段がかけ離れているものは除外します。モデル化への影響がでかい(本音) あまりにも高い物件はそもそも求めてないですし。
では東京23区でプロットし直すとこういう感じ。
中心部が見事に消えました。あんまり住宅地のデータがありませんでした。
大阪もいってみよー
大阪も全データをプロットすると極端に高い位置が2箇所
右が商業地を除いたプロット。大阪も中心部がぽっかり。ちょっと横のスケールがずれたので変形させてます。
次回こそモデル作りへ入ります。