计算机视觉 课件 第7、8章 卷积神经网络的基本概念、 目标检测.pptx

计算机视觉 课件 第7、8章 卷积神经网络的基本概念、 目标检测.pptx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章卷积神经网络7 目 录7.1卷积层7.27.3池化层激活层7.4全连接层计算机视觉 7.57.6卷积神经网络示例卷积的有效性 计算机视觉 20世纪60年代,Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时,发现其独特的网络结构可以有效地降低反馈神经网络的复杂性,提出了卷积神经网络卷积神经网络模仿人脑神经元对外界事物的认知过程,通过对神经网络模型的连续训练,模型就可以像人脑一样识别特定的事物。 计算机视觉 浅层卷积层得到底层特征,如物体边缘特征;中层卷积层输出中层特征,如物体轮廓形状;深层卷积层则输出高层特征,如物体整体特征。卷积神经网络包括:卷积层(Convolutional Layer)、池化层(Pooling Layer)、全连接层(Fully Connected Layer) 计算机视觉 7.1 卷积层(Convolutional Layer)卷积层是卷积神经网络的核心之一,其主要作用是从原始数据中提取出特征。对图像的每一个像素点,计算它的邻域像素和卷积核的对应元素的乘积,然后加起来,作为该像素位置的值。卷积计算过程如下图,用一个3×3的卷积核在大小为5×5的图像上以步长为1进行滑动,重复相同的点积计算操作,得到3×3的结果,该结果称为卷积特征(Convolved Feature)。卷积核是一个核矩阵W,W中各个元素的值正是我们进行模型训练时要训练的参数,即CNN的主要任务就是学习出卷积核。 计算机视觉 7.1.1Padding(填充)为了构建深度神经网络,你需要学会使用的一个基本的卷积操作就是padding,让我们来看看它是如何工作的。两个缺点:一是输出缩小,另一个问题是图像边缘的大部分信息都丢失。第一个缺点是每次做卷积操作,你的图像就会缩小,从6×6缩小到4×4,你可能做了几次之后,你的图像就会变得很小了,可能会缩小到只有1×1的大小。你可不想让你的图像在每次识别边缘或其他特征时都缩小,这就是第一个缺点。第二个缺点是,如果你注意角落边缘的像素,这个像素点(绿色阴影标记)只被一个输出所触碰或者使用,因为它位于这个3×3的区域的一角。但如果是在中间的像素点,比如这个(红色方框标记),就会有许多3×3的区域与之重叠。所以那些在角落或者边缘区域的像素点在输出中采用较少,意味着你丢掉了图像边缘位置的许多信息。*=6*63*34*4* 计算机视觉 7.1.1Padding(填充)为了解决这些问题,可以在卷积操作之前填充输入的图像,即在原图像边缘上进行行列填充,一般也叫作补零(因为大多数时候添加的元素都是0),如下图所示。这样就可以使得卷积运算之后图像的大小不会发生改变,这种在边缘增加像素点的操作就叫做填充(padding)。填充(padding) 计算机视觉 7.1.1Padding(填充)在上图中,p=1,也就是在图像周围都填充了一个0,图像大小由原来的4x4变成?6x6。如果采用3x3的卷积核,以步长为1对原图像进行卷积操作,则卷积之后的特征图大小为2x2。将同样的卷积操作应用于填充之后的图像,所得卷积特征图大小为4x4。也就是说,经过填充之后,卷积特征图变小、边缘信息丢失等缺陷得到了改善。 填充值p可以任意取值,也可以选择填充2个。对于填充多少个像素值,通常有两种选择,分别为Valid卷积和Same卷积,采用Valid卷积意味着No?padding,也就是一般的卷积。若采用Same卷积,则卷积之后输出大小与输入大小是一样的。 计算机视觉 7.1.2 卷积步长(Strided convolutions)步长为2的卷积图卷积运算后得到的特征图的尺寸可用下面公式计算。 其中,fh、fw表示输出特征图的高和宽,inputh、inputw表示输入图像的高和宽,kh、kw表示卷积核的高和宽,p表示填充大小,s表示步长。图7-6中,inputh = 7,p=0,kh=3,s=2,可得fh=3,fw的计算与此类似。 计算机视觉 -为什么要使用卷积?1、通过卷积可以提取特征通过第一个卷积核计算后的feature_map是一个三维数据,在第三列的绝对值最大,说明原始图片上对应的地方有一条垂直方向的特征,即像素数值变化较大;通过第二个卷积核计算后,第二行的数值绝对值最大,说明原始图片上对应的地方有一条水平方向的特征。2、卷积层的两个主要优势在于参数共享和稀疏连接一是参数共享。观察发现,特征检测如垂直边缘检测如果适用于图像的某个区域,那么它也可能适用于图像的其他区域。即:图像的左上角区域以及旁边的各个区域都可以使用这个3 * 3的过滤器,你不需要添加其他特征检测器*=*= 计算机视觉 二是使用稀疏连接。稀疏连接:输出只依赖输入单元格,与其它像素无关 如图:这个0是通过3×3的卷积计算得到的,它只

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档