Tut 7
Tut 7
University of Toronto
Av = λv
Av = λv
λv − Av = 0
(λI − A)v = 0
det(λI − A) = 0
A−1 = P D−1 P −1
B = P DP −1
P DP −1 = U ΣΣ⊤ U ⊤
1 √
Therefore, U = P and Σ ≡ D 2 or σi = di .
θ̂ = argmax L(θ; x1 , · · · , xN )
X 0 1 2 3
P (X) 2θ/3 θ/3 2(1 − θ)/3 (1 − θ)/3
∂l
=0
∂θ
1 1
→ 5( − )=0
θ 1−θ
→ θ̂ = 0.5
Radford M. Neal, Bayesian Methods for Machine Learning, NIPS 2004 tutorial
Intro ML (UofT) CSC311-Tut7 29 / 31
Computing the posterior
P (parameter)P (data|parameter)
P (parameter|data) =
P (data)