PRML読書会 第一回目まとめpart2

Chapter1:序論

Machine Larning ←膨大なデータにも対応できる。

  • 文字の識別(画像から文字を識別する)
  • y: x → t :category をつくる。
    • Training : {x_{1} , ... , x_{n} }に対して(手動での)ラベリング
    • Test: xのcategory決定が可能に
  • Machine Learning の色々

多項式フィッティングを題材にしてみる

多項式フィッティング

背景にある関数が存在する。

有限個の点を取り、その関数を推定する。

  • Observation
    • x = \{ x_{1} , ... , x_{n} \}^{\mathrm{T}}
    • t = \{ t_{1}, ... , t_{n} \}^{\mathrm{T}}
  • Target: new input  \hat{x} に対し  \hat{t}を予想。
Model
  • y(x,w) = \sum_{j=0}^{M}w_{j} x_{j}
  • wに関して線型
    • Curve fitting
    • Polynomial - M-dimention,w(係数)
    • どうやったら最適なパラメーターが得られるのか?
    • wの決定: Error functionの最小化。←最小二乗法
    • Mの決定: Generalizationをよくする。
Over-fittingの回避
  • Nをふやす。
  • Regularization(正則化)
  • w用のTraining setとM用の Validation set
  • Bayesian approach!