- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于遗传BP 网络的城市空气质量等级预测
0 引言
2013 年,“雾霾”成为年度关键词,采用新空气质量标准的74 个城市中,只有海口、舟山和拉萨3 个城市达到了空气质量二级标准. 2014 年1月4 日,国家减灾办、民政部首次将危害健康的雾霾天气纳入2013 年自然灾情进行通报. 空气质量的好坏及其对环境和民众健康的影响开始成为公众热议的话题. 因此,对空气质量进行预测预报研究,对于防灾减灾以及公众健康都是十分重要的.预测预报方法通常采用小波网络、贝叶斯网络等,利用遗传BP 网络的预测预报方法一直是人们关注的研究课题. D. E. Rumelhat 和J. L.McClelland 在1986 年提出了一种利用误差反向传播训练的神经网络,简称BP(Back Propagation)网络. 该算法具有较好的非线性映射能力,使得复杂问题能在很多中间过程未知情况下得到较合理的解答. 但典型的BP 网络仍然存在过早收敛问题[5-6],而且如何确定隐含层节点数目前尚无理论上的指导,需要反复实验确定. 遗传算法(Genetic Algorithm)具有并行计算、鲁棒性强等特点,特别适用于全局寻优问题. 遗传BP 网络融合了BP 网络与遗传算法各自的优点,非常适合于建立预测模型,在股市预测[8]、电力负荷预测、产品销售、环境保护等方面有着广泛的应用. 本文尝试使用遗传BP 网络,对城市空气质量等级进行预测.
1 神经网络的特点
神经网络仅仅依靠输入数据和输出数据就能完成网络的训练,学得蕴藏在输入数据与输出数据之间的模式,而不需要关心学习过程本身,极大的简化了对数据的处理过程,扩展了应用范围. 但是神经网络预测有其局限性,并非所有的问题都可以用神经网络来进行预测. 其中一类是完全随机的问题,如彩票,这类问题不能用神经网络来进行预测;另一类不可预测问题是无法获得输入信息,例如地震预测.
由于与空气质量等级相关的因素众多,我们并不知道该问题是否属于上述不可预测问题. 在本案例中,我们尝试使用气象信息对空气质量等级进行预测,首先对数据进行了分析. 网络预测输出为空气质量等级,共6 类( 优、良、轻、中、重、严重),若输入输出之间为随机的,预测正确率17%(即1 /6). 在进行简易编码后使用典型BP 网络对空气质量等级进行了预测,预测正确率在40% 左右,40%的预测正确率在可预测问题里相对较低,BP 网络应用于很多问题预测正确率可达70% 以上,但该预测正确率仍远高于随机预测,足以证明的问题的可预测性.
2 数据预处理
2. 1 文字属性编码
以大连市2013 年10 月28 日开始的空气质量等级记录为例,选取大连市2013 年11 月~2014 年4 月(共181 个样本) 的天气记录及空气质量等级作为训练数据,预测未来数天的空气质量等级. 输入信息如图1.图中包含了大量的文字信息,依次为天气1、天气2、最高气温、最低气温、风向1、风力1、风向
2、风力2.
众所周知,BP 网络擅长处理数字问题,所以需要对文字信息进行编码. 风向信息可依据角度进行编码,例如北风为0(度)、南风为180(度) 天气属性按湿度大小编码,我们可以认为天气为“小雨”比“晴”湿度大,所以“晴”排在前面,“小雨”排在后面,但某天“阴”也不见得一定比某天“多云”湿度大,对于这种凭直观感觉难以区分的情况,任选一个排在前面即可;空气质量等级由好到差依次与0、0. 2、0. 4、0. 6、0. 8、1 相对应.
2. 2 输入属性筛选
本文使用典型的遗传算法对输入属性进行筛选.
具体计算流程为:首先使用二进制编码方案对输入属性进行编码,若该属性参与运算则该属性的标志为1,若该属性不参与运算则该属性的标志为0. 然后,使用预测值与实际值之差的绝对值的倒数作为适应度,对标志位串进行寻优. 最后,得结果为11110111000,对应表如表1.根据属性筛选结果及高度相关变量二选其一原则,最终选取天气1、天气2、最高气温、最低气温、风力1 和风力2 共6 个变量作为输入.
2. 3 数据关联方案
针对空气质量等级的预测使用了2 类共10种输入输出数据关联方案.类1 为不需要天气预报的预测方案,方案1为当天的气象情况关联未来1 天的空气质量等级,方案2 为当天的气象情况关联未来1、2 天的空气质量等级,……,方案6 为当天的气象情况关联未来1 ~ 6 天的空气质量等级. 这类关联方案的理论依据就是样本输入对样本输出变化的影响,例如今天下雨会使明天的空气变好,但并不是所有的神经网络预测都可以使用该方案,因为
- 软件下载与安装、电脑疑难问题解决、office软件处理 + 关注
-
实名认证服务提供商
专注于电脑软件的下载与安装,各种疑难问题的解决,office办公软件的咨询,文档格式转换,音视频下载等等,欢迎各位咨询!
文档评论(0)