- 1、本文档共40页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于联网直报用户行为的宏观数据预测研究
目录 1
摘要 4
ABSTRACT 5
引言 6
第一章文献综述及研究思路 7
1.1文献综述 7
1.1.1 大数据下用户行为预测研究的文献综述 7
1.1.2 统计系统在大数据领域的研究现状 7
1.2研究思路和预期意义 7
1.2.1 研究思路 7
1.2.2 预期意义 7
第二章数据收集及预处理 7
2.1 数据来源与结构 7
2.2 数据的预处理 7
2.3相关软件的选择 7
第三章工业企业数据报送行为研究 7
3.1 奇异值与缺失值处理 7
3.1.1 所有企业数据报送行为的描述 7
3.1.2 原因分析及数据再处理 7
3.2 对企业报送行为的数据描述与可视化 7
3.2.1 企业积极度的数据描述 7
3.2.2 企业关注度的数据描述 7
3.2.3 企业重视度的数据描述 7
3.3 工业增加值增速的影响因素研究 7
3.3.1工业增加值增速与企业上报产值增速的关系研究 7
3.3.2 工业增加值增速与企业报送行为的关系研究 7
3.4 基础数据的关系小结 7
第四章基于企业报送行为的宏观数据预测模型 7
4.1 研究方法的选择 7
4.2 模型的自变量筛选 7
4.3 基于全部企业行为的工业增加值增速变化趋势预测模型 7
4.3.1 模型的交叉验证结果 7
4.3.2 模型的评价 7
4.4 基于完整报送行为企业的工业增加值增速变化趋势预测模型 7
4.5 企业报送行为的宏观数据预测模型研究小结 7
第五章基于熵权评价法企业选择及宏观数据预测模型 7
5.1 熵权评价法 7
5.2 数据集的构建和企业选择 7
5.3 交叉验证结果 7
5.4 利用2014年各月真实数据的预测模拟 7
5.4.1 国家反馈的各月工业增加值增速变化趋势 7
5.4.2 利用平台数据测算的各月工业增加值增速变化趋势 7
5.4.2 利用平台企业行为模型预测各月工业增加值增速变化趋势 7
第六章主要结论和未来研究方向 7
5.1 主要结论 7
5.2 论文的改进方向和建议 7
附录1:数据来源与结构 7
附录2:数据预处理与数据结构 7
附录3:文中使用到的R软件程序 7
第三章使用到的R软件程序示例 7
第四章使用到的R软件程序示例 7
第五章使用到的R软件程序示例 7
第六章使用到的R软件程序示例 7
参考文献 7
图表目录
图 1:本文研究的方法论图示 7
图 2:所有企业数据报送行为密度曲线 7
图 3:企业积极度的柱状图和密度曲线 7
图 4:分区县和分企业类型的企业积极度箱线图群 7
图 5:企业关注度的柱状图和密度曲线 7
图 6:分报告期、分单位类型的企业关注度箱线图群 7
图 7:分区域和区县的企业关注度箱线图群 7
图 8:企业重视度的柱状图和密度曲线、分组箱线图 7
图 9:分区域、分区县的企业重视度箱线图群 7
图 10:分单位类型的企业重视度箱线图群 7
图 11:工业增加值增速与企业上报产值增速的关系 7
图 12:工业增加值增速与企业上报行为的关系 7
图 13:VAMOM2作为连续变量时的自变量选择 7
图 14:全部企业行为模型的交叉验证结果 7
图 15:完整报送行为企业模型的交叉验证结果 7
图 16:熵权评价法企业选择的企业模型的的交叉验证结果 7
图 17:2014年7月三种模型预测结果和实际情况的对比 7
图 18:2014年各月三种模型预测结果和实际情况的对比 7
图 19:所有数据集、所有模型的交叉验证结果 7
表格目录
表 1:dataset0的结构 7
表 2:各指标的熵和熵权 7
表 3:2014年各月重庆市工业增加值增速及变动率 7
表 4:2014年各月联网直报平台企业上报率 7
表 5:2014年各月平台已上报企业测算的工业增加值增速变化情况 7
表 6:2014年各月三种模型预测的工业增加值增速变化情况 7
表 7:2014年各月三种模型预测的工业增加值增速误差 7
摘要
该项目也为其它领域、区域(包括国家)的企业报送行为的研究和开展预测提供了一种可行的思路和方法。
关键字:联网直报大数据交叉验证熵权评价法
ABSTRACT
To study the complexity, heterogeneity and relevance of the user behavior in the network direct reporting system, to better understand the reporting behavior of enterprises and to analyze the trends according to the reporting time, we studied 141,218
文档评论(0)