Tensorflow で OLS(最小二乗法) ~その1~
はじめに
先日、Google社製のライブラリTensorflowを使ってみました。 備忘録も兼ねてブログにまとめていきます。
本ブログでは、スクレイピングした賃貸情報データを元に 家賃(非説明変数)と他の情報(説明変数)を用いて回帰分析を行います。
分析対象データ(物件情報)
取得データ変数(抜粋)
家賃 | 専有面積 | 管理費 | 礼金 | 最寄り駅から の距離 |
建築年数 | 建築材 |
---|---|---|---|---|---|---|
万円 | m2 | 円 | 万円 | 徒歩N分 | N年 | 木造・鉄筋・鉄骨 |
具体例(抜粋)
スクレイピングデータはこんな感じです。
今回分析すること
家賃を非説明変数として、取得したスクレイピングデータを元に 賃料(=家賃+管理費+礼金/24)をどれだけ説明出来るか分析してみます。
今回は前段階としてざっくりと家賃(Y軸)と説明変数候補(X軸)をプロットしてみます。
X軸(建築年数)
X軸(専有面積m2)
X軸(徒歩分数)
プロットしてみた感じだと、
- 建築年数は賃料と負の相関
- 専有面積は賃料と正の相関
- 最寄り駅からの近さと賃料からは相関は微妙
といった傾向が見えます
次回、賃料に対して上記3つの変数がどの程度影響与えているのか最小二乗法を使ってみます。