选择性集成迁移算法分析-analysis of selective integration migration algorithm.docxVIP

选择性集成迁移算法分析-analysis of selective integration migration algorithm.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
选择性集成迁移算法分析-analysis of selective integration migration algorithm

摘要传统的机器学习分类算法大多需要满足训练数据和测试数据服从相同分布的条件,根据已有的标记样本建立分类模型,对测试样本进行分类预测。但是在实际情况中,这样的同分布假设往往无法得到满足,当数据分布发生改变时,就会导致学习到的模型无法很好的应用到测试数据上,于是传统的机器学习算法需要从零开始,重新标注大量的训练数据,但是标注新数据需要耗费大量的财力、人力及物力,若丢弃掉那些大量的不同分布下的过期的训练数据也造成了资源的浪费。这时,迁移学习变得尤为重要,因为它可以从一个任务的数据中获取知识,来帮助新任务的学习。迁移学习是一种新的机器学习框架,旨在将一个环境中的知识应用到新环境的领域与任务中。因此,迁移学习不需要服从数据同分布假设的条件。本文将较全面的介绍迁移学习的研究概况,并结合集成学习对迁移算法做了如下的研究:(1)提出了选择性集成迁移学习算法。根据目标域有标记样本的信息,对源域进行初步的筛选,然后对筛选后的源域进行随机采样获取N个源域子集,由它们在目标域训练样本上的经验误差进一步筛选源域子集,最终将选取的源域训练子集分别与目标域训练样本组合成相应的多个训练集,训练分类器并对目标域测试数据集多数投票预测。该算法充分利用了源域中的有用信息及多样性,通过训练集的重组,提高目标域训练样本在训练集合中的贡献率,取得了一定的效果。(2)提出了基于维数约简的集成迁移学习算法。对于特征维数庞大的样本分类,如果对特征进行降维,可以降低源域与目标域之间的差异性,更好地迁移源域的标签信息,同时可以降低算法的时间复杂度。新算法通过将源域数据进行Boostrap采样T遍,并与目标域测试数据结合成对应的T个数据集,通过对每个数据集分别进行SVD维数约简,在对应的各个低维空间中,分别由K近邻预测目标测试数据,最终再集成投票。结合了集成和降维后,新算法表现出比较好的性能。(3)提出了基于半监督的集成迁移学习算法。前两个算法都是通过有标记的训练数据建立模型,然后用于预测测试数据。通过引入了目标领域中的无标记样本参与训练,采用半监督自训练模式,并利用动态数据集重组集成思想,提出一种新的半监督的集成迁移算法,在剪切源域中差异性大的样本的同时,添加目标域无标记样本扩充目标训练样本集,与一些迁移算法相比,分类效果有一定的提高。关键词:迁移学习集成学习选择性维数约简半监督II选择性集成迁移算法研究AbstractMostoftraditionalmachinelearningalgorithmsarebasedontheassumptionthatthetrainingandtestdatamustbeinthesamefeaturespaceandfollowthesamedistribution.Usetheexistingmarkedtrainingsampletosetupclassificationmodel,andpredictthetestdatabythismodel.Butinfact,thisassumptionwiththesamedistributionoftencannotbesatisfied,whenthedatadistributionchange,itmaycausethatthelearnedmodelcannotapplytotestdataverywell,insuchcase,thetraditionalmachinelearningalgorithmsneedtostartfromscratch,markalargenumberoftrainingdataagain,whichisveryexpensiveandtime-consuming.Thisleavesplentyoflabeledexamplesthatareunderasimilarbutdifferentdistribution,whichisawastethrowawayentirely.Inthissituation,transferlearningbecomesimportanttotaketheroleoflever-agingtheseexistingdataknowledge.Transferlearning,asanewlearningframework,aimsatbuildingasystemtoapplyknowledgeandskillslearnedinprevioustaskstonoveltasks.Thus,transferlearningdoesnotmaketheidenticaldistributionassumptionastractionalmachinelearningalgorithms.Inthisthesis,wec

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档