Linear Regressionの精度をどうはかるか?
以前にLinear Regressionの精度はどう考えればいいのだろうか?
ということを日記に書きました。
Week5までのまとめとLinear Regressionの精度の考え方 - 暇人日記
悩みはJがいくらだったら精度が高いとか低いとかXX%と言えるんだろう、
ということでした、
Logistic RegressionでははっきりとXX%と出るのですが、
Linear RegressionではJが20億と言われてもピンとこないという悩みでした。
受講しているUdemyのコースの中に決定係数という考えが出てきましたので
これを使ってJが20億だったのはどういう値だったのかということを
見てみたいと思います。
決定係数は0から1の間をとり1に近ければ近いほど精度が高いという
指標です。
決定係数はPythonのStatsModelに含まれています。
早速実行してみました↓
決定係数はR-squaredで表記されているので0.733です。
やっぱり高くて良いとみていいか、低くて悪いとみていいかわかりませんorz
違うところで面白いものが見えました。
赤丸で囲ったroomのp値です。
この値は0.5以上だと予測に影響を与えていないという指標なのですが、
roomは5以上あります。
これは家の価格を面積と部屋数から分析する課題だったのですが、
部屋数は関係ないというように示されています。
Octaveで標準化して計算してパラメーターです。
部屋数に関するパラメーターは3つ目なので、これでみると
あってもなくても関係ないというようには見えないのですが。。。
不思議ですが、面白いです。
また時間あるときに考えてみます。