- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
O2O商户运营成效评价:因子分析
今天和大家一起来探讨SPSS数据分析工具中的“因子分析”。
因子分析主要用于分析商户O2O运营数据,了解商家的行为信息,找出数据背后的共性,最终对商家进行综合评价,挖掘商家特点。
首先我们来看看因子分析相关的基础知识。
基础知识讲解(不读)
任何分析都有其目的,因子分析的目的是什么呢?
探索结构:在变量之间存在高度相关性的时候,我们希望用较少的因子数目来概括其信息。
简化数据:把原始变量转化为因子后,使用因子得分进行分析,比如聚类分析、回归分析等。
综合评价:通过每个因子得分计算出综合得分,对分析对象进行综合评价。
因子分析的步骤
判断数据是否适合因子分析
构造因子变量
利用银子旋转方法使得因子更有实际意义
计算每个个案的因子得分
那么,如何判断数据是否适合因子分析?
因子分析的变量要求为连续变量,分类变量不适合直接进行因子分析。
建议个案个数为变量个数的5倍以上,这只是参考值,不是绝对标准。
KMO检验统计量:小于0.5时不适合因子分析;大于0.5小于0.7时,尚可以接受因子分析;大于0.7小于0.8时,比较适合因子分析;大于0.8时非常适合因子分析。
如何展开因子分析?
选择分析-降维-因子,调出因子分析工具。
选择需要进行分析的变量。
点击【描述】
勾选“KOM和巴特利特球形度检验”,目的是用于生成检验因子分析适合度的统计指标。
点击【提取】
方法选择“主成分”,这是最常用的提取因子的方法;
勾选“碎石图”,用于辅助判断因子个数。
点击【旋转】
选择“最大方差法”,用于更好的解释因子所包含的意义。
最大方差法师最常用的,该方法能够使每个变量尽可能的在一个引子上有较高的载荷,在其余因子上载荷较低,从而方便对因子进行解释。
点击【得分】
勾选“保存为变量”,方法选择“回归”,用于保存计算的到的因子得分。
点击【选项】
勾选系数显示格式中的“按大小排序”,是为了让系数大小有序,方便观察;勾选“排除小系数”,输入0.4,这样在结果中相关系数小于0.4的会被排除,不再显示,也是为了方便观察(因为我们是寻找相关系数高的)
注意:这里不必生搬硬套,也不必也定时0.4,可视具体情况而定
分析结果解读:
该结果主要用来检验数据是否适合因子分析,主要参考KMO统计量即可。
KMO统计量为0.627,大于0.5小于0.7,尚可以接受因子分析。
这个结果是“变量共同度”,显示了原始变量能被提取的因子解释的程度。
本例中所有变量共同度都在60%以上,可以认为所提取的因子对各变量的解释能力是可以接受的。
该图是“总方差解释”,显示了通过分析所提起的因子数量,以及所提取的因子对所有变量的累计方差贡献率。
累计方差贡献率大于60%,则说明因子对变量的解释能力尚可接受,达到80%,说明因子对变量的解释能力非常好。
本例根据“初始特征值”大于1的标准提取了两个因子,旋转之后累计方差贡献率达到72.367%,因子的解释能力较好。
碎石图”能辅助我们判断最佳因子个数,通常是选区取现中比较陡峭的位置所对应的因子个数。
本例前三个音字都在较陡峭的曲线上,所以提取2~~3个因子都可以对原始变量有较好的解释。
如何确定提取的因子个数呢?
初始特征值(总方差解释图)大于1的因子个数
累计方差贡献率(总方差解释图)达到一定水平的因子个数(如60%)
碎石图中处于陡峭曲线上的对应因子个数。
根据经验或研究,指定个数。
这是旋转之前的因子载荷矩阵,难以对因子进行明确定义,可以忽略不看,直接看旋转后的因子载荷矩阵。
“旋转后的成分矩阵”显示的是旋转后的因子载荷矩阵,这个结果能够凸显因子含义。
第一个因子:载荷较大的变量是“网店浏览量”、“论坛浏览量”、“线上广告费用”、“实体店访客数”,说明这四个变量与该因子的相关程度较高,其中前三个是反映的是线上数据,“实体店访客数”放映的虽然是线下数据,但是与第一个因子呈现反向关系。综上所述可以吧第一个因子命名为“线上商务”。
第二个因子:载荷较大的是“实体店铺货数”、“线下广告费用”、“地面推广引入量”,说明这个变量与因子的先关程度较高,并且反映的都是线下情况。综上所述可以命名为“线下商务”。
注意:系数是按我们设置的降序排列,并且有的为空,是因为我们设置的排除小于0.4的系数是因子结果更加清晰,可读。
这个图没什么用,可以忽略不计。
新生成了两个变量就是每个商户在两个因子上的得分:第一个因子的得分,第二个因子的得分。
最后,如何计算综合得分?
计算综合得分有个公式:第一个因子占的加权比重数*第一个因子得分+第二个因子占的加权比重数*第二个因子得分
本例中旋转后的方差解释图知:
因子1贡献率为38.968%,因子2贡献率为33.399,累积贡献率为72.367
所以因子1占的加权比重数=38.968/7
您可能关注的文档
- 信息组织架构 信息组织架构 32uxmattersMy IA Summit 2006 Experience Part 4 The Conference Day 3(4).docx
- 信息组织架构(拓展) 信息组织架构(拓展) 导航设计总结.docx
- 信息组织架构(拓展) 信息组织架构(拓展) 响应式导航设计模式.docx
- 休闲农业产品营销 休闲农业产品营销 案例—把普通胡萝卜“变身”卖到40元一斤,高价农产品销售的套路怎么玩?.doc
- 绣稿设计(油画) 绣稿设计(油画) “毕业开放展示周”活动资料.doc
- 绣稿设计(油画) 中外油画发展史 中国当代油画概述.doc
- 绣花工艺设计与制作 链目绣 链目绣.docx
- 绣花工艺设计与制作 贴布绣 贴布绣.docx
- 虚拟车间 烧结生产虚拟仿真实训系统技能训练指导手册 宝钢烧结生产虚拟仿真技能训练指导手册.doc
- 虚拟化技术与应用(国家) VMware Data Protection安装指导书 部署VDPA实验指导书.doc
文档评论(0)