暇人日記

アラフォーおっさんのコーセラの機械学習の課題を解こうと頑張っています!

2021-01-01から1年間の記事一覧

Udemyコースで教えてもらったLinear Regressionの基本の流れ データクリーニング

基本の流れは大きく2つのパートに分かれていました。 前半 データクリーニング 後半 予測 です。 予測はCoursera Machine Learningの内容に入っていましたが、 データクリーニングは入っていなかったので面白かったです。 前半のデータクリーニングは大まか…

Linear Regressionの精度をどうはかるか?

以前にLinear Regressionの精度はどう考えればいいのだろうか? ということを日記に書きました。 Week5までのまとめとLinear Regressionの精度の考え方 - 暇人日記 悩みはJがいくらだったら精度が高いとか低いとかXX%と言えるんだろう、 ということでした、…

仮説検定 後半

今回は「薬は血中マグネシウム度を向上させる」という仮説検定に 取り組みたいと思います。 こうあってほしい仮説は「薬は血中マグネシウム度を向上させる」なので、 採用したくない、こうあってほしくない帰無仮説は 「薬は血中マグネシウム度を向上させな…

仮説検定 前半

仮説検定は今まで書いてきた『差がある』といえるかと信頼区間を足した内容 だと思いました。 投薬は血中マグネシウム度上昇に効果があったのか、というのは 投薬後の血中マグネシウム度 - 投薬前の血中マグネシウム度がプラスだったら、 『効果がある』と…

信頼区間を図で考えてみる

『差がある』といえるか-統計学-前編で書いた 式の詳細はおいといて、<信頼区間>は上限と下限があり この例では 95%の精度で信頼区間は0.01-0.65となります。 を図で考えてみたいと思います。 まず、信頼区間の意味です。 精度が95%とは95%の確率で平均…

『差がある』といえるか-統計学‐後編

一番使いそうなパターンが前々回の日記と前回の日記のパターンでしたが、 Udemyの講義にはほかのパターンもあったので、表にまとめてみました。 全部で4つの信頼区間の式がありました。 各々の使う条件は表に書いたことが講義中に述べられていました。 母分…

『差がある』といえるか-統計学-中編

NYのリンゴの価格とLAのリンゴの価格ではどちらが高いか、ということを NY10個のサンプル、LA8個のサンプルをもとに考えるという課題の要約に 取り組みます。 ①2つの母集団が正規分布 <--前回の日記と同じ かつ ②2つの母集団は独立 <--前回の日記と異なる …

『差がある』といえるか-統計学-前編

Deep Learning Specializationをうけるためには、 Pythonを理解したほうがいいと思い、このコースに取り組んでいます。 www.udemy.com 主目的はPythonに習熟したいだったんですが、コースの1/3を終えても Pythonは出てこずひたすら確率/分布/統計の勉強とな…