- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(C) Vipin Kumar, CSci 5980 Data Mining, Spring 2004 (C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 模式识别: 特征的选择和提取 目录 6.1引言 6.2 类别可分离性判据 6.3 特征提取 6.4 特征选择(重点) 6.1 引言 特征的选择与提取是模式识别中重要而困难的一个环节: 分析各种特征的有效性并选出最有代表性的特征是模式识别的关键一步 降低特征维数在很多情况下是有效设计分类器的重要课题 特征的选择与提取简述 两类提取有效信息、压缩特征空间的方法:特征提取和特征选择 特征提取 (extraction):用映射(坐标变换)的方法把原始特征变换为较少的新特征 特征选择(selection) :从原始特征中挑选出一些最有代表性,分类性能最好的特征 特征的选择与提取举例 细胞自动识别: 原始测量: 细胞的数字图像 原始特征: 细胞面积,胞核面积,形状系数,光密度,核内纹理,和浆比 压缩特征:原始特征的维数很高,需压缩以便于分类 特征选择:挑选最具分类信息的特征 挑选两个好的特征:胞核面积、光密度 特征提取:坐标变换 产生两个新的特征,它们由原始特征的变换得到 特征选择?特征提取? 哪种方法更适用于我们专业? 生物相关的问题,往往需要真实的特征。 例如:基因芯片中的特征为基因: 特征选择将得到有代表性的重要基因,这些特征基因是真实的。 特征提取将从原始特征得到新的特征,这些特征不能称为特征基因。 特征选择?特征提取? 哪种方法更适用于我们专业? 目录 6.1引言 6.2 类别可分离性判据 6.3 特征提取 6.4 特征选择(重点) 6.2 类别可分离性判据 类别可分离性判据:衡量不同特征及其组合对分类是否有效的定量准则 理想准则:某组特征使分类器错误概率最小 实际的类别可分离性判据应满足的条件: 度量特性: 与错误率有单调关系 当特征独立时有可加性: 单调性: 常见类别可分离性判据:基于距离、概率分布、熵函数 准则函数例子 准则函数例子 其它可分性判据 基于概率的可分性判据:用概率密度函数间的距离来度量 目录 6.1引言 6.2 类别可分离性判据 6.3 特征提取 6.4 特征选择(重点) 此时, 对 求导,令 得变换w为: 的特征值 按大小顺序排列为 则选前r个特征值对应的特征向量作为w。 即 目录 6.1引言 6.2 类别可分离性判据 6.3 特征提取 6.4 特征选择(重点) 经典特征选择算法 许多特征选择算法力求解决有哪些信誉好的足球投注网站问题,经典算法有 单独最优特征组合法、后退法、前进法(重点) 分支定界法 模拟退火法(重点) Tabu禁忌有哪些信誉好的足球投注网站法 遗传算法(重点) 穷举法 由原始的D维空间降到d维空间问题。 一共有q=CDd种特征组合结果。 D=20,d=10时,q= D=100,d=10时,q= 穷举法(最优方法):一定能找到最优解 如果计算每组特征组合的J值,然后选择J值最优的特征组合,往往非常耗时。计算量上无法承受。 怎样减少计算时间? 使用一些次优方法,以大大减少计算时间。 为什么有如此多的特征选择算法? 没有哪个算法能够保证兼顾运算时间又能得到更优的解。 单独最优特征组合 计算各特征单独使用时的可分性判据J并加以排队,取前d个作为选择结果 特征选择结果(取前d个) 不一定是最优结果 当可分性判据对各特征具有可加性(各特征独立),该方法可以选出一组最优的特征来,例: 顺序前进法 顺序前进法( Sequential Forward Selection ,SFS)是一种自下而上的有哪些信誉好的足球投注网站方法,它从0个特征开始每次增加一个特征,所增加的特征应使它与已入选的特征组合在一起所得J值为最大,直到特征数增加到d为止。 设已选入了k个特征构成了一个大小为k的特征组Xk,把未入选的D-K个特征xj,j=1,2,…,D-k,按与已入选特征组合后的J值大小排列: 若 则下一步的特征组选为Xk+1=Xk+x1 顺序前进法考虑了所选特征与已入选特征之间的相关性,一般来说比单独方法好。 主要缺点是一旦某特征已选入,即使由于后加入的特征使它变为多余,也无法再把它剔除。 广义顺序前进法 把SFS法推广为每次不止增加一个特征而是增加L个特征,就成为广义顺序前进法(Generalized Sequential Forward Selection, GSFS)。即每次从未入选的特征中选择出L个特征,使得这r个特征加入后J值达最大。 GSFS法计
您可能关注的文档
- 蒙氏理论文章:《幼儿园教育指导纲要(试行)》.doc
- 蒙氏理论文章:帮助孩子踏上自律之路—管教中的自由与纪律.doc
- 蒙氏理论文章:从现代认知角度重新解读蒙太梭利教学法.doc
- 蒙氏理论文章:从现代认知心理学角度重新解读蒙太梭利教学法.doc
- 蒙氏理论文章:创设蒙台梭利教育环境的几点经验.doc
- 蒙氏理论文章:德国幼儿园的蒙台梭利.doc
- 蒙氏理论文章:放飞独立的翅膀.doc
- 蒙氏理论文章:儿童之家的建立及规章制度.doc
- 蒙氏理论文章:感官教育.doc
- 蒙氏理论文章:简述蒙台梭利的纪律教育观.doc
- 模式识别课程讲义(李君宝)1 模式识别绪论-2学时.ppt
- 模式识别课程讲义(李君宝)2 贝叶斯决策理论-3学时.ppt
- 模式识别课程讲义(李君宝)3. 概率密度函数估计-3学时.ppt
- 模式识别课程讲义(李君宝)5 线性判别函数-2学时.ppt
- 模式识别课程讲义(李君宝)4 线性判别函数-2学时.ppt
- 模式识别课程讲义(李君宝)6 特征的提取与选择-4学时.ppt
- 模式识别课程讲义(李君宝)8 主成分分析-2学时.ppt
- 模式识别课程讲义(李君宝)7 近邻法-2学时.ppt
- 模式识别课程讲义(李君宝)9. 人工神经网络-2学时.ppt
- 模式识别课程讲义(李君宝)10. 无监督与模糊学习-2学时.ppt
有哪些信誉好的足球投注网站
文档评论(0)