暇人日記

アラフォーおっさんのコーセラの機械学習の課題を解こうと頑張っています!

Linear Regressionの精度をどうはかるか?

以前にLinear Regressionの精度はどう考えればいいのだろうか?

ということを日記に書きました。

 

Week5までのまとめとLinear Regressionの精度の考え方 - 暇人日記

 

悩みはJがいくらだったら精度が高いとか低いとかXX%と言えるんだろう、

ということでした、

 

Logistic RegressionでははっきりとXX%と出るのですが、

Linear RegressionではJが20億と言われてもピンとこないという悩みでした。

 

受講しているUdemyのコースの中に決定係数という考えが出てきましたので

これを使ってJが20億だったのはどういう値だったのかということを

見てみたいと思います。

 

決定係数は0から1の間をとり1に近ければ近いほど精度が高いという

指標です。

 

決定係数はPythonのStatsModelに含まれています。

早速実行してみました↓

 

f:id:omoshiroamericanews:20210515225221p:plain

 

決定係数はR-squaredで表記されているので0.733です。

やっぱり高くて良いとみていいか、低くて悪いとみていいかわかりませんorz

 

違うところで面白いものが見えました。

赤丸で囲ったroomのp値です。

この値は0.5以上だと予測に影響を与えていないという指標なのですが、

roomは5以上あります。

これは家の価格を面積と部屋数から分析する課題だったのですが、

部屋数は関係ないというように示されています。

 

Octaveで標準化して計算してパラメーターです。

f:id:omoshiroamericanews:20210515231139p:plain

部屋数に関するパラメーターは3つ目なので、これでみると

あってもなくても関係ないというようには見えないのですが。。。

 

不思議ですが、面白いです。

 

また時間あるときに考えてみます。