データ分析でお得な物件を探したい part.1
導入
東京都内に引っ越したいです。突然ですが。
ただ田舎者なため、大都会TOKYOの土地勘も無ければ知り合いも少ないため、データからお得な地域を割り出して参考にしようかと思います。
~~ここまで強引な導入。
最終的な目標は、
東京都内の「家賃モデル」を作り、ある物件を指定したとき、その物件の”場所情報や築年数”を入力すると、このぐらいの家賃が相場だよ、というデータが出てくること にします。
データ集め
今回は手始めに東京の地価を調べてグラフ化してみます。
地価の情報って公開されてるんですね。すばらしい。
国土交通省からデータをもらってきます。
地価そのままグラフ化
地価のデータでは、経度緯度と地価がわかるので、そのままプロットしてみます。
ただし、3次元データになるため、地価は色で表します。最も高い値段を赤色、最も低い値段を青色にし、
その間を255分割して表示します。
つまり赤っぽいゾーンほど地価が高く、青っぽいゾーンほど地価が低くなります。
よーし、これで大体の傾向がつかめるだろうと意気揚々とグラフを作ってみのがこちら。
・・・255分割ですよね? あれ?2色?
あ、プロット数多いので赤色の具合で大体地域わかるのは素晴らしい。
なぜこんな色分布になったのか、そんなに地価が2極化してるのかな、とおもって地価をグラフにしたのがこちら。
あ・・・(察し)
どうやら特定の地域だけめちゃくちゃ地価が高いみたいです。そのまま物件の家賃に反映されるかはわかりませんが、これはひどい。
グラフはもうちょっと分布が見たいので、地価の4乗根でもとってプロットしてみますか。
あと地図とも重ねあわせ。グーグル先生お借りします。
こんなかんじになりました。
さて、これからは”この地域ならこの価格が妥当”みたいなモデルづくりに入っていきますよっと。
続く。