徐书环应用统计论文.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
徐书环应用统计论文.doc

基于聚类分析的区域大中型工业企业自主创新能力的划分 徐书环 管理科学与工程 摘 要 为了对区域大中型工业企业自主创新能力进行全面、科学的评价,基于聚类分析法,提出了地区大中型工业企业自主创新能力评价指标体系及聚类分析模型。通过对我国29个省市区大中型工业企业的实证分析,表明该方法科学简便,具有很好的实用价值,可以应用到多个方面。 关键词 ?? 聚类分析?? 大中型工业企业?? 自主创新 1 引 言 聚类分析又称群分析,是研究对样品或者指标进行分类的一种多元回归统计方法。聚类分析的目的是,通过观测数据所进行的分析处理,按一种度量个体接近程度的统计量,确认分类数目,建立一种分类方法,并按接近程度对观测对象给出合理的分类。聚类分析方法被应用到许多实际领域,本文研究其在对中国各省市大中型工业企业创新能力划分中的应用。中国各省市大中型工业企业的自主创新能力,在许多方面都存在较大差别,但我们可以发现有部分省份在各方面的数据特征极为相似,通过归类我们可以从大类上了解各省份大中型工业企业创新方面的特点。因此本文利用聚类分析方法,把全国各省分成几类,通过对大类的比较分析,找出各自的优势与劣势,可以为各省大中型工业企业自主创新能力的提升提供一些参考依据。 2 聚类方法介绍 聚类方法是对样品即个体以某种相似性为度量标准进行分类的一种计量方法。简单地说,是一种研究“物以类聚”问题的探索性方法,将一批样本数据按照其亲密程度在没有先验知识的情况下自动进行分类。传统的聚类算法主要有聚类方法、层次聚类方法、系统聚类方法,本文主要采用的算法来划分不同区域。 下面对算法加以简单介绍。 算法是以平均值作为类的“ 中心”的一种分割聚类方法。用调用此过程可完成由用户指定类别数的大样本资料的逐步聚类分析。所谓逐步聚类分析就是先把被聚对象进行初始分类,然后逐步调整,得到最终分类。假设有个对象, 将其分成个类。其中,分成的聚类的个数是采用算法必须预先指定的参数。聚类的过程有以下步骤[2]: (1)随机地选择个对象,每一个对象作为一个类的“中心”,分别代表将要分成的个类; (2) 根据距离“中心”最近的原则,寻找与每个对象最为相似的类,将其他对象分配到各个相应的类中; (3)在完成对象的分配之后,针对每一个类,计算其所有对象的平均值,作为该类的新的“中心”; (4)根据距离“中心”最近的原则,重新进行所有对象到各个相应类的分配; (5)返回步骤(3)1 企业自主创新能力评价指标体系 目标层 一级指标 二级指标 自主 创新 能力 体系 潜在创新资源投入 产品销售收入占全国产品销售收入的比重(%) 人员中科学家和工程师占从业人员的比重(%) 创新活动能力 经费占产品销售收入比重(%) 科技活动经费占产品销售收入比重(%) 创新产出能力 新产品销售收入占产品销售收入的比重(%) 发明专利申请数占全国发明专利申请数比重(%) 创新外部环境 科技活动经费筹集中政府资金比重(%) 科技活动经费筹集中金融机构贷款比重(%) (1) 潜在创新资源投入能力。潜在的技术创新资源包括人力资源存量和经济资源存量,它主要反映某区域内的所有企业潜在的技术创新能力,选择了产品销售收入占全国产品销售收入的比重和人员中科学家和工程师占从业人员的比重两个指标来衡量。 (2) 创新活动能力。从企业技术创新活动的活跃程度角度选择了两个指标,分别是经费占产品销售收入比重、科技活动经费占产品销售收入比重。 (3) 创新产出能力。从企业自主创新的实际产出与潜在产出方面精选两个指标,分别是新产品销售占产品销售收入的比重和发明专利申请数占全国发明专利申请数比重。 (4) 创新外部环境。科技活动经费筹集中政府资金比重和金融机构贷款比重这两个指标分别反映了政府部门与金融机构对企业创新的扶植与支持,是衡量企业创新外部环境的重要指标。 3.2 数据采集 本文中的数据主要来自2009年版的中国科技统计年鉴上2008年的全国各省市大中型工业企业的相关数据。由于西藏和海南的数据资料不全,无法进行分析,因此收集整理了剩余的29个省市的相关数据,进行处理分析。相关数据见附录。 3.3 区域划分 我们选用科技统计年鉴上的29条数据记录,以相关系数作为差异度度量方法, 直接采用算法进行聚类。将8个具体指标用表示,通过对的不同赋值,得到不同的分析结果。经过反复试验,最后聚成四类时,各类中对象比较集中,而类与类之间区别也大,所以本例认可聚成4类的结果,各类平均值详见下表2,各类最终距离中心的距离见表3,分类情况见表4。 表2 聚类结果的各类平均值表 类别 1 13.30 3.00 1.00 1.50 16.70 39.30 2.50

文档评论(0)

整理王 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档