- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
变量间的相关关系(例题与教材问题相同,只是数据采用不同)
* 前面我们学习了怎样对收集来的数据进行分析: 频率分布图 离散程度 集中趋势 下面我们来介绍一中更为常见的分析方法: 小明,你数学成绩不太好,物理怎么样? 也不太好啊. 学不好数学,物理也是学不好的 ?????... 你认为老师的说法对吗? 事实上,我们在考察数学成绩对物理成绩影响的同时,还必须考虑到其他的因素:爱好,努力程度 如果单纯从数学对物理的影响来考虑,就是考虑这两者之间的相关关系 我们在生活中,碰到很多相关关系的问题: 物理成绩 数学成绩 学习兴趣 花费时间 其他因素 商品销售收入 K×广告支出经费 ? 粮食产量 K×施肥量 ? 付出 K×收入 ? 人体脂肪含量 K×年龄 ? 以上种种问题中的两个变量之间的相关关系,我们都可以根据自己的生活,学习经验作出相应的判断,“规律是经验的总结”,不管你多有经验,只凭经验办事,还是很容易出错的,一次在寻找变量讲的相关关系时,我们需要一些更为科学的方法来说明问题. 在寻找变量间的相关关系时,统计同样发挥了非常重要的作用,我们是通过收集大量的数据,对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.下面我们通过具体的例子来分析 在一次对人体脂肪含量和年龄的关系研究中,研究人员获得了一份样本数据: 根据上述数据,人体的脂肪含量与年龄之间有什么样的关系? 说明:各个年龄阶段的脂肪数据是这个年龄样本的平均数 分析:从总体上看随着年龄的增长,脂肪含量也在增加,为了确定这一关系的细节,我们需要对数据进行分析,我们可以通过前面的做统计图表的方法分析,我们可以对两个变量间的关系有一个直观上的影响和判断.我们也可以通过下面的图(散点图(scatter plot))来分析: 通过分析、观察可以看到:随着年龄的增长,人体脂肪含量越高,这表明两个变量之间的确存在一定的关系。 从散点图可以看出:所有的点大致在一条直线附近波动,我们称这两个变量间存在线性相关关系,这条直线叫做回归直线(regression line) 递增我们叫它们正相关 递减我们叫它们负相关 英国科学家探险家和人类测量学家。1822年2月16日生于伯明翰,1911年1月17日卒于伦敦附近的萨里。C.R.达尔文的表弟 首先发现回归现象的是英国生物学家高尔顿和皮尔逊,他们分别在遗传学研究中发现,生物后代的属性与其父母有关,这种关系仅仅在平均程度上有所差别。他们发现,高个子父母的子代平均高度比较高,矮个子父母的子代平均高度比较低,进一步的研究又发现,高个子子代的平均高度要比父代的高度低,而矮个子子代的平均高度要比父代的高度高,形成向种族平均高度靠拢的趋势,高尔顿将这种现象称作为“回归”。回归分析的目的就是确定变量之间数量关系的可能形式,并用一个数学模型来表示这种关系形式。 皮尔逊 Karl Pearson (1857-1936) Francils galton 如果可以求出这条直线的方程(回归方程),那么我们就可以比较清楚的了解年龄与体内脂肪含量的相关性.这条直线就可以作为两个变量具有线性相关关系的代表 1. 测量法:移动直线l使所有点到它的距离之和最小 演示 2.两点确定法:选取两点作直线,使其两边点个数一样 演示 3.分组法:将点进行分组点,分别求其斜率和截距,求平均值 (1) (2) (3) 演示 有一个非常直接的想法,就是利用一条直线来刻画数据的趋势,这条直线必须保证到所有点的距离最小,最小二乘法(method of least square)就是基于这种想法。 点到直线的距离公式如何表示? 我们可以看到,利用距离公式在计算方面是比较麻烦,因此我们想将它简化,你知道怎样简化吗? 演示 有演示我们知道,我们可以这样来刻画“距离” 假设一条直线的方程为:y=a+bx,对于给定的一个样本点(xi,yi),我们用 来刻画这个样本点与这条直线的偏移距离,用它们表示二者之间的接近程度 由于它可正可负,为了避免相互抵消,可以考虑用 来代替,由于绝对值不方便计算,所以可以改善为? 来刻画n各点和回归直线在整体上的偏差 有一元二次函数的知识很容易算出当 时,Q取得最小值 .下表是某小卖部6天卖出热茶的杯数(y)与当天气温(x)的对比表: (1)试用最小二乘法求出线性回归方程;(2)如果某天的气温是-3℃,请预测这天可能会卖出热茶多少杯 (1)作散点图如图所示 解 由散点图知两个变量是线性相关的,计算各种数据如下表 于是: 则: 分步计算减少出错 于是,线性回归方程为? y=57.557-1.648x 2)由回归方程知,当某天的气温是-3℃时,卖出的热茶杯数为 57.557-1.648×(-3)≈63(杯) 1.利用最小二乘估计时,首先要作出数据的散点图,利用散点图观察数据是否具有线性关系 2.散点图呈现线性关
您可能关注的文档
最近下载
- 县商务局深入贯彻学习教育自查评估报告.docx VIP
- 2025秋苏科版(2024)七年级上册数学课件 1.2 活动 思考.pptx
- 反家暴培训课件内容.ppt VIP
- 24CJ40-52 建筑防水系统构造(五十二).pdf VIP
- 山东省新能源机制电价竞价信息填报承诺书、分布式光伏项目竞价代理委托书、竞价授权委托书、见索即付履约保函(模板).docx VIP
- 阻塞性睡眠呼吸暂停相关性高血压临床诊断和治疗专家共识2024.pptx VIP
- GBT 51345-2018海绵城市建设评价标准.doc VIP
- 航测11000地形图测绘项目技术设计书.docx
- 建设项目职业病防护设施设计专篇编制导则.pdf VIP
- 《旋转式沸石吸附浓缩装置技术要求》(T_CAEPI 31-2021).pdf VIP
有哪些信誉好的足球投注网站


文档评论(0)