- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
如何写一份好的数据分析报告
分类(Classify)聚类(Cluster)常用分析算法AB预测(Predication)D相关(Correlation)CK-means、K-medoids回归、slopeone……贝叶斯、K-NN……Pearson、欧式……在互联网的数据挖掘中,爬虫类算法〔深度优先、广度优先、最正确优先〕也经常被用于数据采集工作
什么是分类?鸟类占50%以上所以把这个群体定义为鸟
什么是聚类?物以类聚
什么是相关?
经典算法描述——贝叶斯待分类内容拆分关键字分类字库分类完成自我学习①②③④⑤
经典算法描述——K-means随机选K个点作为临时中心点①把每一个点配给最近的中心,并计算新的中心②N次循环第2步完成最终聚类③
经典算法描述——slopeone?筛选数据源①衡定内容间关系②?≈预测结果③
分析常用图形散点图善于发现因果关系用于探索性数据分析目的是探索自变量和因变量之间的关系直方图不仅能够度量被计量事物的数目、频数,还能表达各个区间所代表的整个数据集的百分比雷达图善于描述某实物各个属性的强弱分布除此以外,一些组合图也常用于分析描述,如柱-线图,柱-饼图……
年份XXX普及率1月2月3月4月5月6月7月8月9月10月11月12月2008年74.01%78.45%72.66%72.11%75.64%74.25%73.64%74.42%74.97%73.11%72.51%74.00%2009年79.04%74.91%72.06%71.71%73.34%71.58%73.11%72.50%70.80%71.80%69.27%69.99%2010年71.05%75.31%70.95%69.58%70.50%70.94%71.81%72.22%71.12%69.75%68.18%68.64%2011年69.99%74.08%69.26%?案例分析下表为X省XXX普及率,08-10年,及11年1-3月数据。从往年数据明显看出,普及率逐年、逐月都在呈下降趋势,为使11年4月普及率能保持环比/同比不下降,预计需要开展多少0活动用户?
确定分解评估决策普及率开展趋势?普及率=?普及率到达效果?活动客户数/总客户数逐年逐月下降环比持平〔69.26%〕自问自答
确定分解评估决策年份XXX普及率平均1月2月3月4月5月6月7月8月9月10月11月12月2008年74.01%78.45%72.66%72.11%75.64%74.25%73.64%74.42%74.97%73.11%72.51%74.00%74.15%2009年79.04%74.91%72.06%71.71%73.34%71.58%73.11%72.50%70.80%71.80%69.27%69.99%72.51%2010年71.05%75.31%70.95%69.58%70.50%70.94%71.81%72.22%71.12%69.75%68.18%68.64%70.84%2011年69.99%74.08%69.26%?平均73.52%75.69%71.23%71.13%73.16%72.26%72.85%73.05%72.30%71.55%69.99%70.88%普及率在2月有大幅提升,处全年最高年均下降1.65%
确定分解评估决策图表为月平均普及率散点图,趋势线为一次线性回归拟合线,并通过回归统计分析,计算拟合系数及调整拟合系数均远低于标准置信度0.95。因此普及率呈非线性趋势。因此试选用slopeone算法,处理个性化的预测分析。回归统计MultipleR0.566194RSquare0.320576AdjustedRSquare-1.22222标准误差0.013286观测值11月2月3月4月5月6月7月8月9月10月11月12月2010真实71.05%75.31%70.95%69.58%70.50%70.94%71.81%72.22%71.12%69.75%68.18%68.64%2010预测73.22%74.50%70.16%69.46%71.59%70.56%71.14%71.31%70.59%69.91%68.34%69.27%经评预测平局,10年全年预测误差0.0092,去掉1、2月波动后误差0.0065〔即0.65%〕经过SLOPEONE预测,11年4月普及率=67.97%±0.65%
确定分解评估决策经过以上分析及预测,XX省采用67.97%(±0.65%)的预测,对X万0活动用户进行刺激激活。最终完成了预期,保持住了普及率平稳开展。
数据算法分析图形解释选择决定描述总结
谢谢欢送随时交流讨论高福强Mail:QQ:181871805
您可能关注的文档
- 审计学案例分析 1英国南海公司舞弊案 201206194 骆俊华.ppt
- 以案说法姐弟无效婚姻分析郑洁纯.ppt
- 商场vip会员履行计划.ppt
- 企业并购案例——中国平安海外出击饮恨滑铁卢.ppt
- 中国古代婚姻家庭观念透视.ppt
- 议论文如何使用事例论据.ppt
- 税收筹划方法与案例分析 - 税屋网财税政策法规、财税政策.ppt
- 智慧停车O2O项目商业计划书.pptx
- 建筑及房地产业营改增:影响与对策.ppt
- 生产安全事故典型的案例汇编演示教学.pptx
- 教科版(2017秋)科学二年级上册2.6 做一顶帽子 教学设计.docx
- 河北高频考点专训四 质量守恒定律的应用教学设计---2024-2025学年九年级化学人教版(2024)上册.docx
- 大单元教学【核心素养目标】6.3 24时计时法教学设计 人教版三年级下册.docx
- 河南省商城县李集中学2023-2024学年下学期九年级历史中考模拟八(讲评教学设计).docx
- 第18章 第25课时 正方形的性质2023-2024学年八年级下册数学课时分层作业教学设计( 人教版).docx
- Module 8 模块测试 教学设计 2024-2025学年英语外研版八年级上册.docx
- 2024-2025学年小学数学五年级下册浙教版教学设计合集.docx
- 2024-2025学年小学劳动四年级下册人民版《劳动》(2022)教学设计合集.docx
- 2024-2025学年小学数学三年级上册冀教版(2024)教学设计合集.docx
- 2024-2025学年高中生物学必修1《分子与细胞》人教版教学设计合集.docx
文档评论(0)