- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
RVM核参数的遗传算法优化方法
李刚1, 2,邢书宝1,薛惠锋1
(1.西北工业大学自动化学院,陕西 西安 710072,2.西安工业大学经管学院,陕西 西安 710032)
摘 要:RVM (关联向量机)是一种建立在SVM(支持向量机)之上的统计学习方法,利用核函数将回归线性化,求得稀疏解,避免过拟合,核函数的参数严重影响RVM的综合性能。遗传算法是一类随机优化算法,经过迭代进化,高效率地求得问题的最优解。本文在定义RVM回归性能综合评判标准Fitness的基础上,利用遗传算法获取最优核函数参数,实验证明此法的可行。
关键词:关联向量机;核函数参数;综合评判标准;遗传算法
中图分类号:TP391 文献标识码:A
1 引言
统计学习论(Statistical Learning Theory 或SLT)是一种专门研究小样本情况下机器学习规律的理论。该理论针对小样本统计问题建立了一套新的理论体系,在这种体系下的统计推理规则不仅考虑了对渐近性能的要求,而且追求在现有有限信息的条件下得到最优结果。模式分析(pattern analysis)研究的是如何自动检测和辨识数据中潜在的关系,人们通常把这种方法称为“统计模式识别”[1]。随着人们的注意力从线性关系转移到非线性关系,20世纪80年代模式分析领域经历了一场“非线性革命”,几乎同时引入了后向传播多层神经网络算法和高效的决策树学习算法[2]。但是这些非线性算法建立在梯度下降和贪心启发式法的基础上,受到局部最小化的限制。由于没有很好地理解它们在统计上的行为,这些方法经常遇到过拟合的问题。20世纪90年代出现了SVM(支持向量机)[3]等被称为基于核(kernel-based)学习方法的模式分析方法,该方法利用核函数高效线性地分析非线性关系,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的泛化能力 (Generalization Ability)。
RVM (关联向量机)是Michael E.Tipping于2001年提出的一种建立在支持向量机(SVM)之上的稀疏贝叶斯统计学习方法[4],它的训练是在贝叶斯框架下进行的,可以用它进行回归及分类模式分析。RVM克服SVM缺点: RVM的关联向量数要少于SVM,具有更优的泛化性能;可以得到点估计及区间估计;无需多次试验找到最优的类似于C或ε的主观设置值。与SVM类似的是RVM也使用核方法,将自变量映射到高维空间,得到因变量与自变量线性回归的稀疏解,但核函数参数严重影响RVM的性能,如何方便快捷地找到综合性能最优的核函数参数目前尚无解析解理论指导,由于RVM的分类功能建立在回归的基础之上,本文尝试使用遗传算法获取回归综合性能最优的核参数数值解。
2 RVM模型
RVM的模型建立在贝叶斯框架下[5]:
设是训练中的特征值(feature),是目标值, RVM认为服从以为均值的正态分布:
式(1)中:为核函数;为模型的权值。为保证获取稀疏解,令满足0均值正态分布:.训练样本集的似然函数为:式中:;;为矩阵,其行包含所有核函数对输入的响应。根据先验概率分布和似然分布,再用贝叶斯式计算权值的后验概率分布,即:
而该权值的后验分布属于多变量高斯分布,即:
式中:为协方差,其中的是的对角矩阵;为均值。训练目标值的似然分布通过对权值变量进行积分,即:
实现边缘化,从而求得超参数的边缘似然分布:,其中的协方差。
RVM方法中的模型权值的估计值由后验分布的均值给出,同时它也是权值的最大后验(MAP)估计。权值的MAP估计取决于超参数和噪声方差,其估计值和可以通过最大化边缘似然分布得到。后验分布反映出的权值最优值的不确定性,可以表示模型预测的不确定性。若给定输入值,相应输出的概率分布为:服从高斯分布的形式,即:
其中的预测均值和方差(不确定性)分别为:3 RVM回归性能与核函数参数
本文在Tipping的第二类极大似然法(type-II maximum likelihood)求解关联向量的基础上展开研究。给定一个核和一个训练集合,我们就能构成一个核矩阵K(xi,xj),这个矩阵起着信息瓶颈的作用,因为它提供核算法所需所有信息,担当着数据输入和学习模块之间的界面, 如图1所示。
图1 核矩阵数据界面
核函数隐含着数据的相似性衡量尺度,核函数参数起着“放大”与“缩小”的作用,严重影响RVM的回归性能,以Sinc数据为例,说明核函数参数对RVM泛化性能的影响:
Sinc数据为:t=noise+sin(x)/x,x∈[-10,10], noise为1/10水平的标准正态噪声。分别均匀获取100个样本点作为训练集,测试集。选用Gauss核函数(σ
您可能关注的文档
- Recuv恢复软件使用方法.doc
- Relatonship between the length of time off work preoperatively.doc
- remax动电源 移动电源排名 移动电源结构.doc
- Relatonship between iron and heart disease research.doc
- remax动电源 索尼移动电源 那种充电宝好.doc
- Reseach Paper Outline Examples.doc
- Reseach Paper.doc
- reflu and chronic cough.doc
- reseach Proposal.doc
- Revie materials with keys.doc
最近下载
- 型钢悬挑卸料平台监理实施细则.doc VIP
- 2025版必威体育精装版建设工程强制性条文汇编.pdf VIP
- (高清版)DG∕TJ 08-2105-2022 行道树栽植与养护技术标准.pdf VIP
- 无人机组装与调试:多旋翼无人机飞控系统组装调试PPT教学课件.pptx VIP
- 检验检测机构资质认定质量手册和程序文件(质量记录表格汇编).doc VIP
- 建筑机电安装培训.pptx VIP
- 初三物理课件第十六章 3节 电阻课件初三物理课件第十六章 第3节 电阻课件.ppt VIP
- 低空经济产业园招商引资与项目管理.docx VIP
- 燃气经营安全重大隐患判定标准课件.pptx VIP
- 2025年学校基孔肯雅热防控工作预案(精选模板).docx
文档评论(0)