欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 人工智能 > ChatGpt >内容正文

ChatGpt

【清华AI自强计划-计算机视觉课程-第三讲课程笔记1】

发布时间:2023/12/16 ChatGpt 80 豆豆
生活随笔 收集整理的这篇文章主要介绍了 【清华AI自强计划-计算机视觉课程-第三讲课程笔记1】 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

【清华AI自强计划】-第三讲课程笔记-1

数据归一化中的“一”是什么意思?

将不同变量的量纲都转化为1,消除单位的影响。
几种归一化方法:
1、范围(-1,1)

2、范围(-1,1)

3、

以\mu为均值,以\sigma为方差

明确课程定位:

垂直行业从业者&爱好者:

听课目标:0->0.5 定性理解,专注落地

算法科学家:

听课目标:0->1 初步入门,加强算法
提升方法:共享论文

AI工程师:

需要的代码工程能力更强,和真实业务环境相结合,如大量数据需要并行计算,有项目需要上线
听课目标:0->1 初步入门,加强代码 能力
提升方法:工程问题,做作业的时候将每个函数都弄清楚,再做些上下游的工作,如数据是怎么爬取的,将项目上线等。

第三讲目标:训练“识别手写数字”的算法

数据集介绍:
MNIST:
M 指是modified,原来数据集用高中生和公务员的手写数字分别作为测试集和训练集,modified版本将其混合,即将测试集和训练集混合。

如何用逻辑回归解决这一问题?(用二分类解决十分类的问题,One vs All)
训练10个分类器,每个分类器只打1个类别,想解决10分类的问题,训练10个分类器即可。(A defense of one-vs-all classification)
计算机看图是一个数字矩阵:

60000个图片样本,每个样本对应2828的维度,形成上图右边的输入矩阵。
训练结果:样本数量设置为55000时,最后输出预测精度刚超过50%:泛化能力不行。
而当训练样本数为500时,预测精度反而达到90%。
为什么样本数量少,精度反而更高呢?
拟合出来的模型相当于在2828维度的空间中画出决策边界,样本数非常少,以至于随便画条线都可以很好把样本分隔开。

NN神经网络的历史渊源:
生物学神经元衍生出数学模型:

小于一个阈值不激活,大于一个阈值将数据往后传。
神经元多了–>感知机——>(有监督)BP神经网络
无监督:布尔计算机

如何了解一个新模型?

1、了解模型是什么样子的——参数是什么,参数怎么输入
2、了解参数的更新方式
触及到核心知识时是没有任何捷径的,要仔细弄懂每个符号,每个运算过程。

神经元结构图


只有输出没有输入的圆圈代表偏置,作用是让拟合曲线离开原点
输入层和输出层的神经元个数是确定的。

输入层:输入层神经元个数为特征个数
输出层:二分类输出层只有一个,多分类情况下分类类别等于输出层神经元个数。
隐藏层:神经元个数任意指定。

前馈传播示意图解析:
上图中字母上角标括号内的数字代表层数
a,z,x下角标为在此层中的序号
w为模型参数,下角标有两位,前面一位为指向神经元的序号, 后面一位是自己的序号。
全连接:前层每一个神经元和下一层所有神经元都要相连


变量及参数解析:

信号传导下一层神经元先加和到z,再经过激活函数输出a。

矩阵化表示,更加简洁:
第二层的z等于第一层的权值乘以数值。

总结

以上是生活随笔为你收集整理的【清华AI自强计划-计算机视觉课程-第三讲课程笔记1】的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。