第十二讲 特征提取和选择.pptx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章 特征提取和选择5.1 引言5.2 基本概念5.3 类别可分性判据5.4 基于可分性判据的特征提取5.5 主分量分析(PCA)5.1 引言 在模式识别领域,特征的提取与选择是最关键的问题之一,同时也是最困难的问题之一。不同的模式识别应用,需要采用不同的特征提取与选择方法。 对于 实际的模式识别问题,以人脸识别为例,一开始的原始特征可能很多,如在人脸数据库中,每幅图像的分辨率为112?92,即高达10304维。若把所有的原始特征都作为分类特征送到分类器,不仅使得分类器复杂,分类判别计算量大,而且分类错误概率也不一定小;原始特征的特征空间有很大的冗余,完全可以用很小的空间相当好地近似表示图像,这一点与压缩的思想类似。因此有必要减少特征数目,以获取“少而精”的分类特征,即获取特征数目少且能使分类错误概率小的特征向量。 模式识别中减少特征数目(或压缩特征空间)的方法有两种:一种是特征提取,另一种是特征选择。在模式识别系统中, 确定分类和学习过程所使用的特征是非常重要的一个环节,获得对分类最有效的特征,同时尽最大可能减少特征维数,是特征选取的主要任务。 特征选取可以分成原始特诊的采集和转换、有效特征的生成两个步骤。原始特征:通过直接测量得到的特征称为原始特征。比如人体的各种生理指标(描述其健康状况);数字图像中的每点灰度值(以描述图像内容),都是原始特征。特征提取:通过映射(变换)的方法把高维的特征向量变换为低维的特征向量。 通过特征提取获得的特征是原始特征集的某种组合,即A:X→Y,可见新的特征中包含有原有全体特征的信息。特征选择:从原始特征中挑选出一些最有代表性、分类性能好的特征以达到降低特征空间维数的目的。 也就是说,特征选择就是从已有的D个原始特征中挑选出d个特征组成一个特征子集,同时将D-d个对类别可分离性无贡献的或贡献不大的特征简单地忽略掉。 特征提取与具体问题有很大关系,目前没有理论能给出对任何问题都有效的特征提取方法。??如: ?用傅立叶变换或小波变换的系数作为图像的特征;???用PCA方法作特征压缩;???用LDA(线性判别分析,Linear Discriminant Analysis)方法作特征压缩。5.2 基本概念1.特征的特点 模式识别的主要功能在于利用计算机实现人的类识别能力, 它是一个与领域专门知识有关的问题。 研究领域不同,选择的特征也不同,但不论采用什么样的特征,都应该满足如下条件:(1)特征可以获取 模式识别系统的主要处理设备是计算机,因此作为观察对象的数字化表达,观察对象应该是可以通过数据采集设备输入到计算机的。 目前,市场上有各种传感设备和数字化设备,如采集图像信息的图像卡和采集语音信息的声卡等。 作为特征,既可以是数字化表达的结果,也可以是在数字化表达基础上形成的参数性质的值,如图像分割后的子目标特征表达等。(2) 类内稳定 选择的特征对同一类应具有稳定性。 由于模式类是由具有相似特性的若干个模式构成的, 因此它们同属一类模式, 其首要前提是特性相似, 反映在取值上, 就应该有较好的稳定性。(3) 类间差异 选择的特征对不同的类应该有差异。 若不同类的模式的特征值差异很小,则说明所选择的特征对于不同的类没有什么差异,作为分类的依据时,容易使不同的类产生混淆,使误识率增大。 一般来讲,特征的类间差异应该大于类内差异。 2.对特征的要求(1) 具有很大的识别信息量。即应具有很好的可分性。(2) 具有可靠性。模棱两可、似是而非、时是时非等不易判别的特征应丢掉。(3) 尽可能强的独立性。重复的、相关性强的特征只选一个。(4) 数量尽量少,同时损失的信息尽量小。3.特征的类别 特征是用于描述模式性质的一种量,从形式上看可以分为三类:  (1)物理特征 物理特征是比较直接、人们容易感知的特征,一般在设计模式识别系统时容易被选用。 如为了描述指定班级中的某个学生,可以用以下物理特征:性别、 身高、 胖瘦、 肤色等外在特征。 物理特征虽然容易感知, 却未必能非常有效地表征分类对象。(2) 结构特征 结构特征的表达能力一般要高于物理特征,如汉字识别的成功实现离不开结构特征的选择。 结构特征的表达是先将观察对象分割成若干个基本构成要素,再确定基本要素间的相互连接关系。 通过要素和相互连接关系表达对象,可以较好地表达复杂的图像信息,在实际中已经有较多的成功应用, 如指纹的识别就是基于结构信息完成的。 结构信息对对象的尺寸往往不太敏感,如汉字识别时,识别系统对汉字大小不敏感,只对笔划结构信息敏感。  结构特征比物理特征要抽象一些,但仍属比较容易感知的特征,如人的指纹特征、 人脸的五官结构信息等,是目前认定人的身份的重要参数。 (3) 数字特征 一般来说,数字特征是为了表征观察对象而设立的特征,

文档评论(0)

wpxuang12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档