機械学習コトハジメ - 鈍足ランナーのＩＴ日記

分類

数値でなにかを予想する
　jupyter_ml4seで公開されている

0次　定数
2次直線
3次　いい感じ
9次　微妙

次数が増えるとグラフを書くことが不可能になり
人の判断ができなくなる

平方根平均２乗誤差。誤差がなし。過去のデータを再現するのにはベスト。未来のデータは再現できない。過学習。（overfitting)

全データ＋テスト用データを分ける。そうすることで、シンプルで
ベストなものがわかる

敢えて大量のデータを入力させて、過学習を避ける。

0.3の標準偏差。０．３のノイズがのっているんだなと見えてくる
面白い

それは経験で

体型と携帯の乗り換えに意味がなかった。人間が判断して

クロスバリデーションすれば避けられるはず

確率を最大にするｗを計算する。ノイズの幅も計算できてしまう。
過学習だとノイズゼロとでる。