个人赛论文观测站的重组与优化.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
个人赛论文观测站的重组与优化

82 观测站的重组与优化 摘要 本文研究的根据多个气象站之间的相关性程度以及利用它们之间的函数关系,对10个气象站进行重组与优化。 针对问题(1),首先,是判断两组数据的相关性程度。本文从两个角度对两组数据的相关性进行了讨论。第一种是利用SPSS对两个观测站的统计数据进行相关性分析,观察两组数据的相关性程度。第二种是利用EXCEL做出两组数据的折线统计图,对比观察两组数据的走势情况,判断相关性。接着,在得到两组数据的相关性为0.952之后,以第八个观测站的数据为自变量,第七个观测站的数据位因变量进行拟合,分别用线性,二次和三次进行拟合,选择出拟合效果最好的方程,比较发现线性拟合较好,关系为,那么,第七个观测站的数据就可以利用该式和第八个观测站的数值求出。 针对问题(2),要求继续减少观测站的数量,首先,考虑对这10个观测站先进行聚类分析,观察他们的相似性。由EXCEL做出这10个观测点这30年的统计数据的折线图,观察他们的走势,大致有趋势的走势确定聚类的类别数量为5。然后,由SPSS进行自动聚类分析。在得到的5个类别里面,讨论类内部的点个数,对于只有一个点的类留下,对于两个聚点的类,以其中的一个为因变量,另一个为自变量建立它们之间的数量关系,若能得到较为清晰的关系式,则表示作为因变量的观测点可以减少。对于大于两个点的聚类,在考虑去除那些点时,主要的衡量指标是去除的观测站对同一聚类中观测站的信息损失量最小,即考虑方差的大小,选取方差最小的,即其波动是最小的,表示其对整个聚类的信息贡献率也就是最小的。 针对问题(3),在问题(2)已经聚类的基础上,首先,用保留的观测站的数据与减少的观测站的数量关系求出减少的观测站的降水量,并与实际值进行比较。然后,分别计算出没减少观测点之前和减少观测点之后每年的年平均降水量的值,利用两次均值的差检验它是否符合正态分布假设,由观测前后均值差的正态分布的函数,由概率论的相关知识就可以得到预测误差的概率了。 关键词:相关性分析,聚类分析,线性拟合,正态检验 问题的重述 某市有10个县,每个县有一个气象观测站(位置如图),每个气象观测站测得的年降水量即为该县的年降水量。30年来各观测站测得的年降水量如下表(见附件一)。为了节省开支,想要适当减少气象观测站,问题是减少哪些观测站既可以节省开支,又可以使得该市年降水量的信息量损失较小。 1.有人认为第7个观测站和第8个观测站观测到的数据之间有相关关系,第7个观测站可以减少,第7个观测站的年降水量信息可以从第8个观测站观测到的数据中获取,试讨论之。 2.还有哪些观测站可以减少,减少的观测站的年降水量信息如何获取。 3.如果以10个县年降水量的平均值为该市年平均降水量。在减少观测站以前,每个县年降水量都是观测数据。在减少观测站以后,被减少的观测站的年降水量只能从其它观测站观测到的数据中获取。减少观测站以前和减少观测站以后是用两种不同测量计算方法得到该市年平均降水量。两种不同测量计算方法得到的该结果会有误差,试预测误差的绝对值小于10mm的概率是多少?误差的绝对值大于20mm的概率是多少? 问题的分析 本文主要是通过对临近的几个气象观测站进行相似性分析和聚类分析,对于相似性很大并且存在关系的观测站进行合并重组。同时考虑减少合并观测站之后对于该市年降水量统计的误差影响,并就满足题给的两种情况进行了讨论分析。 对于问题(1),只要从第七个观测站和第八个观测站的相关性分析入手,在考察了他们的相关程度之后,要求的数据能从所测得的数据中获得,因此分析他们的数量关系,并且以为自变量,为因变量建立拟合模型,分别进行一次,二次和三次的拟合,根据每组拟合数据的,值和值等判断选择出最合适的方程。 对于问题(2),在第一问的基础上要求继续减少观测站,由于范围扩大到10个观测站,因此首先,考虑对这10个观测站先进行聚类分析,观察他们的相似性。由EXCEL做出这10个观测点这30年的统计数据的折线图,观察他们的走势,大致有趋势的走势确定聚类的类别数量为5。然后,由SPSS进行自动聚类分析。在得到的5个类别里面,讨论类内部的点个数,对于只有一个点的类留下,对于两个聚点的类,以其中的一个为因变量,另一个为自变量建立它们之间的数量关系,若能得到较为清晰的关系式,则表示作为因变量的观测点可以减少。对于大于两个点的聚类,在考虑去除那些点时,主要的衡量指标是去除的观测站对同一聚类中观测站的信息损失量最小,即考虑方差的大小,选取方差最小的,即其波动是最小的,表示其对整个聚类的信息贡献率也就是最小的。 对于问题(3),减少了观测站以后,原始数据的数量就会减少,从而预测误差就会加大。在问题(2)已经聚类的基础上,首先,用保留的观测站的数据与减少的观测站的数量关系求出减少的观测站的降水量,并与实际值进行比较。然

文档评论(0)

xjj2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档