欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

9.4 均值标准化-机器学习笔记-斯坦福吴恩达教授

发布时间:2025/4/5 编程问答 39 豆豆
生活随笔 收集整理的这篇文章主要介绍了 9.4 均值标准化-机器学习笔记-斯坦福吴恩达教授 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

均值标准化

假定我们现在新注册了一个用户 Eve(5),他还没有对任何电影作出评价:

Y=[5500?5??0??40??0054?0050?]Y=\left[\begin{matrix} 5&5&0&0&?\\ 5&?&?&0&?\\ ?&4&0&?&?\\ 0&0&5&4&?\\ 0&0&5&0&?\\ \end{matrix}\right]Y=55?005?4000?05500?40?????

则 Eve(5) 对于电影内容的偏好应当被参数 θ(5)θ^{(5)}θ(5) 所评估,注意到我们的最小化代价函数过程:

min⁡x(1),...,x(nm);θ(1),...,θ(nu)12∑(i,j):r(i,j)=1((θ(j))Tx(i)−y(i,j))2+λ2∑i=1nm∑k=1n(xk(i))2+λ2∑j=1nu∑k=1n(θk(j))2\min_{x^{(1)},...,x^{(n_m)};θ^{(1)},...,θ^{(n_u)}} \frac 12 \sum_{(i,j):r(i,j)=1} ((θ^{(j)})^Tx^{(i)}-y^{(i,j)})^2+\frac {\lambda} 2 \sum_{i=1}^{n_m} \sum_{k=1}^n(x^{(i)}_k)^2 + \frac {\lambda} 2 \sum_{j=1}^{n_u} \sum_{k=1}^n(θ^{(j)}_k)^2x(1),...,x(nm);θ(1),...,θ(nu)min21(i,j):r(i,j)=1((θ(j))Tx(i)y(i,j))2+2λi=1nmk=1n(xk(i))2+2λj=1nuk=1n(θk(j))2

由于该用户没有对任何电影作出评价, θ(5)θ^{(5)}θ(5) 能影响上式的项只有:

λ2∑j=1nu∑k=1n(θk(j))2\frac {\lambda} 2 \sum_{j=1}^{n_u} \sum_{k=1}^n(θ^{(j)}_k)^22λj=1nuk=1n(θk(j))2

为了最小化该式,我们只能令 θ(5)=(00)θ^{(5)}=\left(\begin{matrix}0\\0\end{matrix}\right)θ(5)=(00) ,从而,Eve(5) 对任何电影的评价将会被预测为:

y(i,5)=(θ(5))Tx(i)=0y(i,5)=(θ^{(5)})^Tx^{(i)}=0y(i,5)=(θ(5))Tx(i)=0

显然,这就是一种“不负责任”的预测了,系统会因此认为 Eve 对任何电影都不感冒,那么,Eve 就是吃饱了撑的来注册这个网站。

为了这个解决这个问题,我们会先求取各个电影的平均得分 μμμ

μ=(2.52.522.251.25)μ=\left(\begin{matrix} 2.5\\ 2.5\\ 2\\ 2.25\\ 1.25\\ \end{matrix}\right)μ=2.52.522.251.25

并求取 Y−μY−μYμ ,对 YYY 进行均值标准化:

Y−μ=[2.52.5−2.5−2.5?2.5??−2.5??−2−2??−2.25−2.252.751.75?−1.25−1.253.75−1.25?]Y-μ=\left[\begin{matrix} 2.5 & 2.5 & -2.5 & -2.5 & ?\\ 2.5 & ? & ? & -2.5 & ?\\ ? & -2 & -2 & ? & ?\\ -2.25 & -2.25 & 2.75 & 1.75 & ?\\ -1.25 & -1.25 & 3.75 & -1.25 & ?\\ \end{matrix}\right]Yμ=2.52.5?2.251.252.5?22.251.252.5?22.753.752.52.5?1.751.25?????

对于用户 jjj ,他对电影 iii 的评分就为:
y(i,j)=(θ(i))Tx(j)+μiy(i,j)=(θ^{(i)})^Tx^{(j)}+μ_iy(i,j)=(θ(i))Tx(j)+μi

那么 Eve 对电影的评分就为:
y(i,5)=(θ(5))Tx(j)+μi=μiy(i,5)=(θ^{(5)})^Tx^{(j)}+μ_i=μ_iy(i,5)=(θ(5))Tx(j)+μi=μi

即,系统在用户未给出评价时,默认该用户对电影的评价与其他用户的平均评价一致。貌似利用均值标准化让用户的初始评价预测客观了些,但这也是盲目的,不准确的。实际环境中,如果一个电影确实没人被评价过,那么他没有任何理由被推荐给用户。

总结

以上是生活随笔为你收集整理的9.4 均值标准化-机器学习笔记-斯坦福吴恩达教授的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。