多元线性回归模型..doc

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元线性回归模型.

小组编号:63 多元线性回归模型 ——对于爱知世博会日人流量因素分析 组长:夏 天 组员:李 程 组员:周园园 目录 摘要 问题的提出 背景的分析 问题的分析 模型参数的假设 模型的分析与建立 模型的改进 模型的检验 运用模型求解 摘要 本文提出要求分析中国上海世博会期间的人流量因子问题,我们在分析解决这个问题上,经过仔细的考虑最终确立了多元线性回归模型。在解决这个问题中最关键的地方是如何找出主要影响人流量的因子,进而建立模型。因此在处理整个人流量的问题上我们分两步进行,一是找出主要的影响因子,二是建立回归模型,确定回归系数,确定出各个因子与人流量的函数关系。下面我们做一下详细解释。 题目中所给出的因子有几个,但是一些条件都是运用文字来表达的,这个时候,我就先运用数据处理的办法,利用虚拟参数将现实中的问题数据化,之后来进行分析,运用数学的方法,达到解决问题的第一步。 哪些有用那些无用?到底怎样取舍?经过仔细的分析和推敲,我们发现了需要通过显著性差异来区别我们所选取的各类因子,删除显著性不好的因子,比如,学生假期这一因子,在进行了详细的分析与操作过程后,对于这个因子及相关数据我们将其剔除,在这一处理过程中,我们很灵活的用到了虚拟参数,对于我们接下来的分析及相关过程都提供了一定的便利条件。 将主要的影响因子提取出来后,我们通过建立回归模型来确定自变量与因变量的回归关系,并通过回归分析过程中所得出的一系列数据来说明模型的可信度与参考价值。 最后,我们对所建立的模型提出了建议,并从和客观方面对模型有针对性得提出了改进的方法。主要是通过对残差项的相关分析来反映实质性的问题。 二、问题的提出 该题中所设置的问题是基于2010年中国一个大事件的环境背景下,今年在上海所举办的世博会所吸引了全世界的目光。题目给出了一系列有具体值与具体意义的环境等条件下人流量的具体数目,要求我们根据这些数据来分析世博会中影响人流量的主要因子。之后,通过对这些因子进行各种分析,得出该因子对于人流量的影响机制,建立出基本的数学模型,分析该数学模型的可行性。 我们针对这些给出的详细数据,展开了一系列的讨论,商量出我们的基本思路。在分析之后,我们一致认为,应先筛选出对于人流量影响较大的因子,然后再对筛选出来的因子进行个别或总体的数学分析,进行一定的分析与研究,这样初步简化模型建立中繁琐的数据,同时对于减小模型的误差也起到了一定的作用。在分析的过程中,会运用到回归系数建立回归方程,样本的选取来分析周期性的规律,样本显著性分析等方法来实现我们解决问题的目的。 在建模的过程中,为了做出最合理的结果,我们对于自己的分析过程做出了约束条件:在分析的过程中,尽量剔除用不上,并且很繁杂没有规律性的数据,来减少工作量以及分析的确切度;在模型建立之后,也会通过检验来验证模型的可行度。 三、背景的分析 回归分析就是研究两个或多个变量之间关系的统计方法,通过确定某一变量对另一个变量的影响强度来揭示变量之间的内在数量关系。数理统计诸方法中以回归分析应用最为广泛,早在19世纪回归分析就以最小二乘法的面貌出现,并以矩阵代数为主要数学工具,在实际中开始应用,100多年来它的理论和方法日益丰富,应用面越来越广,并且回归分析的思想已经渗透到数理统计的其他分支之中,如时间序列分析、主成分分析、判别分析等。 回归分析中应用最为广泛,理论上业已经成熟的是多元线性回归,很多非线性的回归问题业可以通过变换转化为线性回归或运用分段回归、多项式回归等来实现,但是在经济领域中的多元回归问题中,诸如自变量之间普遍存在多重共线性,这也是影响回归模型稳定的重要因素,使所得的回归模型中出现了不符合经济学原理的现象。本文在试图建立变量之间的多元回归模型时,也出现了此种情况,为此采用主成分分析回归分析来消除这种多重共线性,建立主成分回归模型。 问题的分析 经过小组的讨论与商议,我们认为这是个多元线性回归模型。下面我们就把我们的分析过程做一下陈述。 题目中给出的数据很多,我们经过分析发现有一些数据只是让我们了解一些情况,并不是所有的数据都要用于世博人流量的分析。我们需要对这些数据做一些剔除,比如,经过初步的分析,我们会发现学生节假日对于人流量的影响并不是非常的明显,在之后的进一步分析中,我们会用科学的知识来得出结论。 其次,经过我们的分析与思考,对于题目中所给出的具体文字性的条件,如星期几等都是由文字给出的条件,我们决定纳入虚拟变量进行相关的求解,这样使文字数字化使得结果更具有代表性,加强特征性。 再次,我们又从中发现了许多不明显但可能对人流量具有较大影响的潜在的影响因子,例如时间序列中,随着时间的累加,总的人数也呈现着一个总体上升的趋势,这在

您可能关注的文档

文档评论(0)

yxnz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档