- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于基站流量数据的用户上网时间分析研究.doc
基于基站流量数据的用户上网时间分析研究
【摘 要】为了有效解决移动用户在不同时间、不同位置对网络的个性化需求问题,通过分析每一个基站每小时的流量数据的特点,采用K-means聚类分析算法来识别每一个基站的繁忙程度,提出了分析移动用户对数据业务的时间与空间需求指导运营商网络规划的方案。经过实验验证了该方案的有效性,并发现基于K-means聚类分析算法识别基站的繁忙程度具有较高的扩展性。
【关键词】K-means 聚类 用户行为 流量数据
doi:10.3969/j.issn.1006-1010.2016.12.006 中图分类号:TP391.4 文献标志码:A 文章编号:1006-1010(2016)12-0029-04
引用格式:黄星辉. 基于基站流量数据的用户上网时间分析研究[J]. 移动通信, 2016,40(12): 29-32.
1 引言
随着智能终端和移动通信的发展,以微信和QQ为代表的OTT(Over The Top,通过互联网向用户提供各种应用服务)业务不仅对无线网络资源消耗形成巨大的压力,而且其数据传输的非连续性造成信道的负荷造成极大的负面影响。如何根据用户上网时间的规律对无线资源进行有效调控成为运营商亟待解决的难题。因此,本文利用基站的在各个小时的上网情况(包括上网人数、上网时长、上传流量、下载流量)进行聚类分析,挖掘整个城市的基站一周或者一个月在各个时间段的繁忙程度,通过对各个基站在各时间段的繁忙程度的对比,运营商可以针对基站的特征做好网络资源需求的精准评估,从而对运营商的网络资源规划提供一个非常重要的数据支持。
2 数据集说明
本文的数据来自于某运营商27万移动用户两周(10月9日至23日)的上网数据,数据的字段信息包括基站名称、数据统计时间、上网人数、上网时长、上传流量以及下载流量等。利用Hadoop工具对数据按照工作日和休息日分别进行统计,得到的结果如表1所示。
4 基于基站流量数据的聚类分析
以某地市运营商为例,通过对每一个基站每天每个时段的数据进行聚类,得到各个时段的繁忙程度,具体如表2所示。
同理,休息日的聚类结果可按照同样的方法统计出来。显然,按照每天的数据进行综合分析,可得出两周内的最终聚类结果,该结果在很大程度上反映了用户的上网时间规律。
通过对上述的基站信息进行整理后,得到了某地市运营商在两周内的上网规律。通过可视化的界面展现基站在不同时段的闲忙分布规律如图1和图2所示(注:1表示最忙,2、3次之,4表示最闲。所谓繁忙程度是对基站自身繁忙程度的刻画,每一个基站的每个小时的类别都有可能取4个值中的任意一个)。
由图1和图2得出结论如下:
(1)主城区的住宅区域的基站最繁忙的时间段集中在闲时(凌晨时间段),与现实的情况相符。这是因为在工作日,移动用户的上网行为主要发生在下班后;相反,在上班时间段内,移动用户主要通过互联网来满足上网需求。
(2)城市内的主要干道的基站最繁忙的时间段集中在早高峰和晚高峰,而在其它时间段则需求量较少;国道、省道在任何时间段的繁忙程度都没有表现出明显的规律。
综上所述,用户在传统忙时上网并不会对主城区住宅区的网络造成重压。因此,对于主城区来说,由于用户上网需求量较少,可以通过适当降低上网价格等营销手段来增加用户的上网时长;同时,在传统闲时保持价格不变也不会减少用户的上网时长,这样会提升运营商的资源利用率及收入。
5 结束语
本文通过对基站流量数据分析用户上网的时间与空间特点,基于每个基站的流量在时间上呈现的不同特点,采用K-means聚类分析算法来识别每个基站的繁忙程度,进而提出了基于移动用户对数据业务的时间与空间需求差异指导运营商进行网络规划的方案。通过实验证明,该方案能够在一定程度上提升运营商的网络资源利用率,有效地指导现网网络资源的部署和优化,实现无线网络精准规划的目标。
参考文献:
[1] 窦智. 城市功能区划分空间聚类算法研究[D]. 成都: 四川师范大学, 2010.
[2] 杨栋. 针对基站聚类和用户行为分析的移动通信网络资源优化技术研究[D]. 北京: 北京邮电大学, 2013.
[3] 蒋石浩,林亚平. 移动用户行为分析的数据预处理算法应用研究[J]. 计算机与数字工程, 2010,38(1): 28-31.
[4] 吕洋. 基于用户行为数据分析的移动互联业务推荐模型[D]. 武汉: 华中科技大学, 2011.
[5] Pavan M, Pelillo M. Dominant sets and pairwise clustering[J]. IEEE Trans on Pattern Analysi
文档评论(0)