Tensorflow で OLS(最小二乗法) ~その1~

はじめに

先日、Google社製のライブラリTensorflowを使ってみました。 備忘録も兼ねてブログにまとめていきます。

本ブログでは、スクレイピングした賃貸情報データを元に 家賃(非説明変数)と他の情報(説明変数)を用いて回帰分析を行います。

分析対象データ(物件情報)

取得データ変数(抜粋)

家賃 専有面積 管理費 礼金 最寄り駅から
の距離
建築年数 建築材
万円 m2 万円 徒歩N分 N年 木造・鉄筋・鉄骨

具体例(抜粋)

スクレイピングデータはこんな感じです。 https://gyazo.com/2a9e3a35f878d855048bf838d4cac83a

今回分析すること

家賃を非説明変数として、取得したスクレイピングデータを元に 賃料(=家賃+管理費+礼金/24)をどれだけ説明出来るか分析してみます。

今回は前段階としてざっくりと家賃(Y軸)と説明変数候補(X軸)をプロットしてみます。

X軸(建築年数)

https://gyazo.com/97f74a310832f1b476d048def62669fc

X軸(専有面積m2)

https://gyazo.com/37d297ef7c107a05d0d1eaba4fa8cff6

X軸(徒歩分数)

https://gyazo.com/1d4f5d3028e42dd34ea60e90f2834ed1

プロットしてみた感じだと、

  • 建築年数は賃料と負の相関
  • 専有面積は賃料と正の相関
  • 最寄り駅からの近さと賃料からは相関は微妙

といった傾向が見えます

次回、賃料に対して上記3つの変数がどの程度影響与えているのか最小二乗法を使ってみます。