課程二.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
課程二

Y的平均值 根據最小平方法得出的迴歸線會通過X所對應Y的平均值。 而每一個E(Y|X)有變異數,迴歸成立的條件之一是該變異數相等,或是說當變異數不等,最小平方法不適用。 E(Y|X)的分佈應該成常態分佈(不過這個條件不影響迴歸模型是否成立) 符號 如果用X表示自變數,Y表示依變數。 如果X, Y皆是母體資料,Y=α+βX α代表截距,β代表斜率,也就是當X變動1單位時,Y變化β單位( α 固定不動) 因此,Y的值隨著X變動而變動。 α,β 如果β0,迴歸線上升,代表X對於Y有正向作用,X越大則Y越大。反之則是代表有負向作用, X越大則Y越小。 如果X=1, Y=α+β。 如果X=0, Y=α。 線性迴歸 線性指的是β係數是一次方,但是自變數X可以不必是一次方。 例如:Y= α+βX2是線性,但是Y= α+√βX不是。 α、β是我們關心的「母體」,我們根據樣本資料可估計a, b來推論α、β,並且加以檢定。 迴歸係數的求法 最小平方法 根據X, Y的觀察值,以最小平方法計算b, a,也就是說y_hat=a+bx。y_hat是代入x之後的預測值。 y_hat的平均值等於y的平均值 yi=a+bxi+ui (完整的迴歸模型) E(yi|xi)= a+bxi(預測模型) ui =yi - E(yi|xi)= yi - a+bxi (殘差) 迴歸線必通過x,y的平均值 線性迴歸估計 每一個樣本裡有許多觀察值,如果變數x, y之間有線性關係,我們計算得出a, b, y_hat等等。 理論上只觀察到一個迴歸方程式,但是如同單變數一樣,我們可以假設許多a, b成常態分佈,因此可以進行假設檢定、計算信賴區間。 殘差 SSE=sum of squared errors,也就是觀察值y跟預測值y-hat(=a+bx)之間的差、也就是殘差的平方和。 殘差的和應該是0,而平方和最小的時候就是最小平方法求出的a, b 總平方和及殘差平方和 總平方和(Total sum of squares):變數的變異數Σ(y - y_bar)2 殘差平方和(Sum of squared errors, residual sum of squares):觀察值與預測值之間的差,也就是迴歸方程式無法解釋的部份。 Σ(y - y_hat)2 總平方和減掉殘差平方和等於迴歸平方和(RSS, Regression sum of squares) 估計y的條件標準差, standard error of the estimate(SEE) SEE 可做為迴歸係數的變異數之估計值。 所以自變數x的變異數越大(或是樣本數越大),在相同的SEE之下,b的標準誤越小,也就是越集中。 交通工具與手機費用 Coefficients: Estimate S. E. t Pr(|t|) (Intercept) 978.42 46.47 21.06 .01 trans.n -240.55 20.50 -11.73 .01 Residual standard error: 194.5 on 269 degrees of freedom 交通工具與手機費用 sse-sqrt(sum(m1$residuals^2)/269) diff.x-trans.n-mean(trans.n) se.b-sse/sqrt(sum(diff.x^2)) se.b 20.5026 Why are there so many Buchanan Voters in Palm Beach County? 2000年的美國總統選舉中,佛羅里達州的Palm Beach郡投票結果顯示保守派候選人布坎南(Buchanan)獲得3407票,但是他所屬政黨認為當地最多只有400個支持者。 因此,有人認為布坎南的票其實部份來自於本來要投給Gore卻誤投給布坎南. 如果布坎南的票都不是誤投,理論上布希的票越多,布坎南票應該越多。 特殊的觀察值 續 原始模型及去掉特殊值模型 預測值 小結 根據兩個迴歸模型,Bush在Palm Beach可能少了2610或是2809票。Buchanan應該只得796或597票。 所以有無Palm Beach此一觀察值影響迴歸係數的大小以及預測值。 預測值有助於我們瞭解觀察值與迴歸方程式之間的差別。 結論 瞭解迴歸方程式的意義 瞭解迴歸係數的求法 瞭解預測值的求法 瞭解殘差的意義 瞭解依變數的條件標準差的求法 課程九 迴歸與相關1 簡介 假設變數之間呈線性關係。 如果依變數是連續變數就可進行迴歸;自變數可以是類別或是連續變數。 可根據迴歸係數預測依變數。 迴

文档评论(0)

75986597 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档