不動産鑑定と機械学習の融合点をずっと模索している。
まず、不動産の価格を予測する。駅や周辺のスーパーやコンビニからの距離とか、土地の面積とかのデータを入力して、その土地の価格を求めよう。こんなのは分かりやすくて、ウチの事務所でも導入済み。
機械学習ではほかに「分類」というのもあります。例えば、1000枚の犬猫の写真を犬と猫に分類したりできます。tensorflowの練習では必ず通る道。
分類は不動産鑑定で使い道はあるかな?
例えばある不動産のデータから、その不動産を住宅と商業に分類するということも考えられるが、そんなもの見ればわかるのでわざわざ機械学習を持ち出す必要はないです。練習でやってみるのはいいことだと思うけど、実務での必要性は全く感じない。
それよりも不動産投資を専門に行っている機関があるとすると、ある投資先(オフィスビルとかホテルとか)がその会社の投資先としてふさわしいかどうかを判断するような場合は役に立つと思います。
教師データをどうするかという問題はあるが、依頼先の過去の投資先とパフォーマンスのデータを提供してもらうことで何とかなりそうです。
まあ利回りだけで投資するならばそこまでやる必要なないかもしれませんけどね。
それからもう少し身近なところでは、ある住宅が売り出されているとして、例えば令和2年10月1日時点でその住宅は「買いか見送りか」ということも考えられます。でもこれをやろうとすると、買わなかった事例をたくさん集める必要があるので、実際は難しいかな。
その住宅の価格を求めるモデルを作って、その価格を越えたら「買わない」、その価格を下回れば「買い」とすることもできるけど、これはあくまでも予測モデルで、分類とは違う。
ところで分類のモデルを作る方法はいっぱいありますが、「決定木」がよく使われます。もっと精度が出せる方法もあるのですが、説明しやすさの点では決定木が一番。
最近は可視化ライブラリーも簡単に使えるものが提供されていて、dtreepltをよく使っています。
「Python実践データ分析100本ノック」という本で、ジムの会員を「退会と継続」に分類するモデルを作る練習をしたことがあるのですが、可視化の部分をdtreepltで自作したのがコレ。
Pythonの本は巷に溢れていますが、これはお勧めできます。
読者レベルは、scikit-learnで基本的なモデルを作ることができるが、データの前処理がいまいち自信がない人かな。
Comments