- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章;目 录;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;第4章;目 录;4.1 HOG特征;HOG特征提取步骤;步骤4:将图像划分成若干个单元cells,例如每个cell为8x8像素。 步骤5:统计每个cell的梯度直方图,即可形成每个cell的描述子。;需要注意的是,如果有一个角度在160-180度之间,这里不考虑方向的正负,角度0和180度可用同一个bin表示,角度为165度,梯度值为85,要把梯度值按照比例放到0和160的bin里面去。;步骤6:将几个cell组成一个block(例如3x3个cell/block),一个block内所有cell的特征描述子串联起来便得到该block的HOG特征描述子。计算block的时候,是把整张图像遍历一遍的过程,窗口移动步长可以设定为1个cell。 步骤7:将图像内所有block的HOG特征描述子串联起来就可以得到该图像的HOG特征描述子,这个就是最终可供分类使用的特征向量。;4.2 SIFT特征;SIFT算法实现;1 DoG尺度空间构造;左边为sigma=1尺???下的图像,中间为sigma=3尺度下的图像,右边为sigma=5的图像,尺度越大,图像越模糊;图像金字塔能够很好的显示图像多尺度空间的特征,SIFT算法中的图像金字塔共有o组,每组有S层,下一组的图像由上一组图像降采样得到。为原图的1/2. ;(3) 高斯金字塔构建;前面已经有了高斯金字塔和DoG算子,根据下图可以进一步计算高斯差分金字塔。在高斯尺度金字塔中,每组包含6层图像,经过高斯差分之后每组为5层图像。; 中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维图像空间都检测到极值点。 一个点如果在DoG尺度空间本层以及上下两层的26个邻域中是最大值或最小值,就认为该点是图像在该尺度下的一个特征点。;由于DoG值对噪声和边缘较敏感,因此,在上面DoG尺度空间中检测到的局部极值点还需要进一步检验才能精确定位为特征点。;;;?;?;3 方向赋值;;前面已经获取了特征关键点的位置、尺度和方向参数,这些特征点已经对上述参数的变化保持了不变性。下一步,就是要生成一种能够描述这些特征的描述子。;(2)旋转主方向 将坐标轴旋转为关键点的方向,以确保旋转不变性;(3)生成描述子;?;两幅图中,给出了SIFT特征匹配的实例,可以看出,两幅图中,猫耳的方向是不同的,采用SIFT特征可成功匹配。由此可见,SIFT具有旋转不变性。;Hash算法是在工程领域中度量两张图像相似度最常用的算法之一。Hash算法通过获取图像的Hash值,比较两张图像Hash值的汉明(Hamming Distance)距离来度量图像是否相似。两张图像越相似,其Hash值的汉明距离越小。 Hash算法可分为三种,分别是平均哈希算法(aHash)、感知哈希算法(pHash)和差异哈希算法(dHash)。下面将对这三种算法进行详细介绍。 ;1 平均哈希算法(aHash);实例:图像aHash值的计算过程;(5)计算汉明距离:得到aHash值后,就可以比较两张图像的aHash值之间的汉明距离,通常认为汉明距离小于10的一组图像为相似图像。;感知哈希算法是基于DCT(离散余弦变换)来得到图片的hash值,其算法步骤为: (1)缩放图像:将图像大小统一缩放为32x32共1024个像素点。 (2)图像灰度化:将缩放后的标准图像转为灰度图像。 (3)DCT变换:对灰度图像做离散余弦变换,得到对应的32×32数据矩阵。 (4)缩小DCT:取上一步32×32数据矩阵左上角的8×8子区域G来替代整幅图像,这部分呈现了图片中的最低频率。 (5)计算像素均值:对8×8矩阵G,计算其所有元素的平均值,假设其值为a。 (6)计算pHash值:遍历G中的每个像素,如果第i行j列元素G(i,j)≥a,则置G(i, j)为1,否则,置G(i, j)为0。最后将二值图像G中的数字从左到右、从上到下串联得到该图像的pHash值。 ;图4-24 转为灰度32x32尺寸的Lena图 图4-25 灰度32x32尺寸Lena图对应的DCT矩阵;Lenna(origin).png 1001100111000100010101000010010101100000001000111000001010000000 ? Lenna(nosie).png 10011000010001000101001010010100010001001000110000001000000000 ? Barbara.png 110011011100000100
您可能关注的文档
- 第1、2章 计算机视觉概述、 Python与OpenCV运行环境.pptx
- 计算机视觉 课件 第5、6章 图像分类、 神经网络基础.pptx
- Python网络爬虫技术与实践 课件全套 第1--10章 Python基础及网络爬虫---爬虫框架SCRAPY与反爬虫.pptx
- Python网络爬虫技术与实践 课件 第1、2章 Python基础及网络爬虫、数据采集与预处理.pptx
- Python网络爬虫技术与实践 课件 第3、4章 静态网页采集、 数据存储.pptx
- Python网络爬虫技术与实践 课件 第5--7章.JavaScript与动态内容、 模拟登录与验证码、 爬虫数据的分析与处理.pptx
- 计算机视觉 课件 第7、8章 卷积神经网络的基本概念、 目标检测.pptx
- 2025年工业互联网平台数据要素市场化配置交易机制报告.docx
- 2025年工业互联网平台数据要素市场化配置商业模式创新报告.docx
- 2025年工业互联网平台数据要素市场化监管体系报告[001].docx
有哪些信誉好的足球投注网站
文档评论(0)