- 1、本文档共112页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
机器学习与大数据技术作者:牟少敏教授
第七章随机森林在棉蚜等级预测中的应用基于邻域核函数的局部支持向量机在树木图像分类中的应用局部支持向量回归在小麦蚜虫预测中的应用机器学习、大数据技术和图像处理技术在农业中的应用基于Spark的支持向量机在小麦病害图像识别中的应用Hadoop平台下基于粒子群的局部支持向量机深度学习在小麦蚜虫短期预测中的应用
创新与贡献研究意义选题背景第七章7.1简介机器学习、大数据以及图像处理技术的迅速发展,为其在农业中的应用提供了强有力的支撑。如:为了提高农业生产效率,2017年9月美国的卡耐基梅隆大学机器人科学家提出了FarmView计划,就是设计和实现集人工智能、物联网技术、计算机视觉和大数据技术于一体的农业智能机器人。传统的病虫害预测预报方法有统计法、实验法和观察法。本章主要结合我们的科研工作,介绍机器学习、大数据技术和图像处理技术在农业病虫害预测预报等方面的应用。
创新与贡献研究意义选题背景第七章7.2随机森林在棉蚜等级预测中的应用棉花是我国的重要经济作物,在山东省滨州地区种植比较广泛。棉蚜是造成棉花减产的主要害虫之一,由于棉蚜虫害的特点是发生时间长、繁殖速度快、危害严重、难防治,因此制约了滨州地区棉花的高产和优产。影响棉蚜发生的条件中气象条件和天敌数量均会对棉蚜的发生产生直接影响。本节主要介绍随机森林在棉蚜等级预测中的应用。随机森林算法(RandomForest,RF)由加利福尼亚大学的LeoBreiman提出的一种由多棵决策树构成的集成分类算法。
7.2.1随机森林原理创新与贡献研究意义选题背景第七章7.2随机森林在棉蚜等级预测中的应用Bagging算法是1996年由Breiman首次提出。Bagging算法在训练过程中抽取部分数据样本进行训练,从而提高了随机森林的训练速度,在规模大的数据集里体现明显。抽样时采取有放回的抽样方法,这样使得一些出现概率低的样本被选取的概率也会降低,减少了样本中噪点的影响。Bagging算法的分类过程:分类的过程类似于简单多数投票法,是从基分类器集合中各分类器的分类结果中选取分类器投票数最多的分类结果的过程。具体的过称为:首先各分类器对数据集的测试样本进行分类,并把每个分类器的分类结果记录下来,然后对分类器的选取结果进行统计,得票数最多的分类结果就是最终模型的分类结果。Bagging算法的原理如图7-1所示。图7-1Bagging算法原理图
创新与贡献研究意义选题背景第七章7.2随机森林在棉蚜等级预测中的应用随机子空间算法随机抽取特征集的部分进行训练,提高了高维数据集的训练过程。该算法的工作原理如下:(1)采用无放回的抽样方法在特征集中随机抽取一部分特征形成特征子集。(2)对特征子集的数据进行训练,形成基分类器。(3)重复上述步骤1和步骤2,直到生成n个分类器。(4)把生成的每个分类器对需要分类的测试样本进行分类,并且对分类器分类的结果进行统计,最终分类器投票数最多的分类结果就是最终的分类结果。
创新与贡献研究意义选题背景第七章7.2随机森林在棉蚜等级预测中的应用随机森林算法以决策树为基分类树,引入了上述两个随机化的过程,结合了Bagging算法和随机子空间算法的优点,从而使得每棵分类树具有不同的分类能力。采用Bagging算法的有放回抽样对训练集进行抽样,并结合随机子空间的算法,使得训练集中只抽取部分特征进行训练。当输入待分类样本时,随机森林输出的结果由每棵决策树的分类结果投票决定。随机森林是一个树型分类器的集合。作为算法中的元分类器是由CART算法组成但没有剪枝的分类回归树。作为独立分布的随机向量,决定了每棵决策树的生长;参数X作为分类器的输入向量。??
7.2.2随机森林构建创新与贡献研究意义选题背景第七章7.2随机森林在棉蚜等级预测中的应用随机森林的算法构建的步骤如下。(1)首先假设数据集的样本总数为N,N为每棵决策树采样的样本数。在N个样本中有放回的随机性选择n(nN)个样本,用选取的n个样本训练一棵决策树。(2)假定每个样本有M个属性,在每棵决策树的节点需要分裂时,从M个属性中随机选择m(mM)个属性,然后从已选择的m个属性中依据Gini指标选择最佳属性作为当前节点的分裂属性。(3)每棵决策树的节点分裂过程是遵循步骤(2)进行的,从而使得决策树中的每个节点不纯度达到最小值,直到不能分裂,此过程不对树进行剪枝。(4)根据生成的多个树分类器对新的测试数据进行测试,分类结果按每个树分类器的投票而决定,即分类公式为
您可能关注的文档
最近下载
- 中医整脊疗法选择题及答案.pdf
- 低脂高蛋白的健康风潮——即食鸡胸肉品类报告.pdf
- 统编版2024新版七年级上册道德与法治知识点提纲(实用,必备!).docx
- ANSI CTA-2034-A-2015 家用扬声器的标准测量方法 Standard Method of Measurement for In-Home Loudspeakers.pdf
- 撤销清算组备案及债权人公告范文.docx
- NYT2915-2016 水稻高温热害鉴定与分级.pdf
- 道德与法治优质课教研评比活动总结简报2021《课堂展风采 教研促成长 》.docx
- 端正入党动机以实际行动争取入党课件.pptx VIP
- 15 特殊健康状态儿童预防接种专家共识之十五——自身免疫性疾病与预防接种_孙金峤.pdf VIP
- 医院培训课件:《用药错误案例分析之RCA根本原因分析法》.pptx
文档评论(0)