贰 资料描述.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
公共管理與政治學研究方法研討班 贰 资料描述 陈陆辉 特聘研究员兼主任 政治大学选举研究中心 美国密西根州大政治学博士 主题 一 何谓统计 二 次数分配表 三 中央趋势/集中趋势 四 离散程度 参考王德育第三章与第四章 一 、何谓统计 1.描述统计(descriptive statistics) 将所观察到研究对象(母体)的相关信息加以归纳整理。 ?? 2.推论统计(inferential statistics) 以既有观察所得数据,来推论超出观察范围的对象。 信赖区间 confident interval 假设检定hypothesis testing 二 次数分配表 在社会科学研究的资料中,通常以類別资料为主。 因此,在描述数据分布时,以次数分配表呈现是一个不错的方式。 台灣民眾對兩岸經貿交流對總體經濟影響評估 表3-2 民众对民进党过去一年来表现的评价(未合并资料) 累积次数分布 累积次数分布 累计该类别以及比该类别的数值还低的所有观察值的次数分布总数 ? 百分位 percentile rank /累计相对次数分布 一个观察值的百分位,系指所有等于以及小于该观察值的所有观察值,累计后的相对次数分布。 表3-3 民众对民进党过去一年来表现的评价(合并后资料) 用图形呈现数据 除了我们用次数分配表来呈现资料之外,我们可以用图形来加以表现。 用圆饼图(pie chart)、长条图(bar chart)来呈现類別数据 用直方图(histogram)来表现包括等距数据以及等比数据的数字数据。 图3-1 2000年总统选举不同省籍背景选民支持对象长条图 图3-2 2000年总统大选三位主要候选人得票百分比的圆饼图 圖3-3 民眾對兩岸關係預期長條圖 圖3-4 民眾對美國好惡程度分佈的直方圖 樣本增加,分佈的變化 當樣本逐漸增加(至無限大),分佈曲線愈區平滑。 各種分佈型態:鐘型 各種分佈型態:U型 偏度(skewness) (一)正偏/右偏 (二)負偏/左偏 (一)正偏/右偏 (二)負偏/左偏 三 中央趋势 平均數(mean) 平均数的特性 各观察值与平均数间的差之总和等于零。 各观察值与平均数之差的平方总和最小。 易受极端值影响。 離差(deviation) 最小平方法(least square) 中位数(median) 找寻一个变量中位数的方式是: 先将我们蒐集到的资料由小到大排序, 找出位于该数据中间的位置, 也就是运用累积相对次数0.50那个位置, 即为中位数所在的位置。 找寻中位数 若是N是奇数,则中位数所在的位置是第(N+1)/2位,该数之值即为中位数 1,2,3,4,5 若是N是偶数,则中位数之值即取第(N+1)/2位的前后两个数再加以平均 1,2,3,4,4,5 數字資料中尋找中位數的方式 類別資料中尋找中位數的方式 中位数的特性 为 中之最小,其中,A为任意常数。所以,就绝对离差之和而言,中位数与所有观察值的绝对离差之和为最小。 中位数不易受极端值的影响。 可惜的是,相对于平均数,中位数不易进行代数计算,所以在過去的统计分析应用机会较少。 众数(mode) 是指 观察值中出现次数最多的那一个数值 找表二與表三的眾數 表三 表二 眾數的特性 適合各種類型資料 眾數的數量:單峰、雙峰、多峰 常態分佈下中央趨勢的位置 鐘型分佈的中央趨勢 二、正偏/右偏 的中央趨勢變化 三、負偏/左偏的中央趨勢變化 雙峰分佈 描述資料的變異程度 討論 中央趨勢是否一致? 兩筆資料的差異 如何描述兩筆資料的變異程度 四 离散程度 全距(range,R) 四分位距(inter-quartile range,IQR) 平均绝对离差(mean absolute deviation ,MAD) 变异数(variance) 标准差(standard deviation) 离散系数(coefficient of variation,CV)。 以下一一介紹 全距(range,R) 观察值中的最大值 – 观察值中的最小值 = R 全距的优点为计算简便,不过,它的两个缺点是: 不够敏感 易受极端值影响 用全距觀察三筆資料 四分位距(inter-quartile range,IQR) 將資料中的第3四分位數 (在全體資料的累積相對百分比為75%者,或是第75百分位數) 減去資料中的第1四分位數 (在全體資料的累積相對百分比為25%者,或是第25百分位數), 所得到的差距,就是四分位距。 四分位距(IQR)分佈圖 箱型圖的分佈 离差(deviation) 平均數的一個特性就是

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档