- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
【原创】定制代写开发r/python/spss/matlab/WEKA/sas/sql/C++/stata/eviews 数据挖掘和统计分析可视化调研报告程序等服务(附代码数据),咨询:3025393450@ 有问题到淘宝找“大数据部落”就可以了 R语言电视剧网播量回归影响因素研究 【研究摘要】 本次研究选取某视频网站爬取的共4266条电视剧的播放信息数据进行分析,以电视剧播放量为因变量,采用逐步回归、线性回归的研究方法,对可能影响播放量的因素进行研究,并根据研究结论为各个视频网站提供提高电视剧播放量的建议。 一. 背景介绍 长期以来,电视剧都是人们业余时间娱乐活动的重要组成部分,晚饭后,一家人围坐在客厅里,在暖暖的灯光下共同看电视剧的场景牵动着几代人心中对温馨家庭生活的热爱。但近年来,随着视频网站和移动端APP的普及,这样的场景已经越来越少见,电视剧网播以其便捷性、自主性取代了传统的“看电视”在人们心中的位置,成为了最广泛的休闲娱乐方式。2016年企鹅智库的一项调查显示,在上千名调查者中,仅有17.7%表示仍会选择电视作为看剧的主要方式,而表示会选择手机和电脑端的受访者则分别达到了73%和48%(此问题为多选题,故各项总和超过100%)。电视剧网播的形式早已渗透到人们的生活中。 电视剧网播的深入人心也为各个视频网站带来了发展的良机。通过播放热门网剧吸引观众创造流量,再以广告或视频会员等形式创造收益的运营模式让包括爱奇艺、优酷、搜狐等在内的众多视频网站一路高歌猛进,创下了不菲的业绩。根据艾瑞咨询发布的报告,2017年爱奇艺的营收将达到117亿元,直逼各大电视台中的佼佼者湖南卫视,象征着视频网站在普及度上超越电视后,终于能在收益上也与其一争高下,也代表着电视剧网播时代的全面到来。 不过,时代在为视频网站提供机遇的同时也带来了挑战。人们精神生活的日益丰富使得电视剧总量越来越庞大。根据CSM媒介研究TVPRIS100城市组的监测数据,2015年10月1日—2016年9月30日期间,全国有电视剧播出的473个地市级以上电视频道,共播出电视剧25387部、160万多集。这个数字还在不断扩大。根据广电总局发布的数据,仅在2016年,备案预备拍摄的电视剧就达到800余部,总计超过三万集。在浩如烟海的电视剧前,如何选择最受观众喜爱的剧目,以最少的版酬换取最大的关注度,成为了事关所有视频网站生死存亡和未来发展的大问题。到底是哪些因素在影响不同电视剧的热度呢?今天,我们就以电视剧播放量为因变量,对可能影响它的因素进行研究,以期为各个视频网站提供行之有效的建议。 二.变量介绍 ?在本次研究中,我们选用了某视频网站上爬取的共4266条数据进行分析。数据中的变量除因变量播放量外,还有剧名、类型、点赞、6差评、得分、采集日期6个变量,可分为基本信息、评价、采集情况3类,具体的变量介绍如下表所示。 表?1?变量介绍 变量类型 变量名 详细说明 取值范围 备注 因变量 播放量 连续变量 1000~68亿 单位:次 自 变 量 基本 信息 剧名 文本数据 无 电视名称 类型 定性变量 古装剧、武侠剧等类型 一个电视剧可有多个类型 评价 点赞 连续变量 0~8,613,347 单位:个 差评 连续变量 0~99,889 单位:个 得分 连续变量 2.4~10 有部分缺失值 采集情况 采集日期 日期 2015-9-23到2015-10-9 无 三. 描述性分析 因变量分布 在开始探究影响播放量的因素之前,我们首先希望能对因变量的分布有一定的了解。本次探究的因变量是电视剧在网上的播放量,播放量的中位数为7910万,而均值则高达2亿4千万,属于明显的存在少数极端值影响了均值的情况。由图1可知,大部分电视剧的播放量对数值分布在8~11间,即播放量主要分布在2980万到6亿之间。在所有电视剧中,播放量最高的是15年的热门剧《花千骨》,最高播放量达到68亿,而最低的是名为《青春集结号》的军旅剧,播放量仅有一千出头。 图?1?播放量对数值分布直方图 电视剧类型 在我们所使用的数据中,每个电视剧都可以有不止一个类型,如《花千骨》同时属于言情剧、古装剧、偶像剧三个类别。在这种情况下,分类画箱线图会产生一定的混乱,故在此仅以词云的形式呈现不同电视剧类型出现的频率。从图2中可以看出,原数据中网络剧、年代剧等占比较高。可能是由于该类别的定义较为宽泛,许多电视剧都属于该类。 图?2?电视剧所属类别词云 评价 在我们的数据中,评价情况共涉及点赞数、差评数和得分三个变量,在此选用相关系数的方法对这三个变量与因变量的关系进行初步探究。我们绘制了如图3所示的相关关系图,从图中可以看出,点赞数、差评数和播放量有很强的正相关关系,而得分稍弱。可能是因为播放量多的电视剧才有更
您可能关注的文档
最近下载
- 健康体检与管理专业医疗质量控制指标(2023版)全面解读.pptx
- SOP-Agilent1260HPLC(HPLC标准操作程序).pdf VIP
- 2025山东省社会治安综合治理中心招聘备考题库附答案.docx VIP
- 消防产品现场检查判定规则.ppt VIP
- 低空产业联盟:低空智能网联体系参考架构(2024版).pdf
- 服务器虚拟化精选.pptx VIP
- NB∕T 10907-2021 风电机组混凝土—钢混合塔筒设计规范.pdf
- 新时代中国特色社会主义理论与实践2024年版课后题答案.pdf
- 浅谈小学生良好阅读习惯的的培养.docx VIP
- 火力发电厂水工设计规范-2018.docx VIP
有哪些信誉好的足球投注网站
文档评论(0)