- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Hadoop平台在电信企业的应用实践.pdf
第4l卷第4期 数 字 通 信 Vol41.No。4 72 2014年8月 25日 DigitalCommunication Aug.25 2014 DOI:10.3969/j.issn.1005—3824.2014.04.018 Hadoop平台在 电信企业的应用实践 杨国博,舒满昌,王贤稳,熊安萍 (重庆邮电大学 计算机科学与技术学院,重庆400065) 摘 要:随着电信企业的业务发展,其运营网络、业务系统及支撑系统等生产 了大量的日志数据,这些数据蕴含 了 大量有用信息,传统 日志处理方式限制了企业对海量 日志文件的处理、分析及应用。针对电信企业特定应用平台 产生的大量 日志文件 ,实践了Hadoop平 台的MapReduce编程模型,该平 台以HDFS作为底层文件 系统,以Hbase作 为可扩展的数据存储 系统,更大幅度地提高了对 日志数据分析的效率,具有较好的实用价值。 关键词:海量 日志文件;I-Iadoop;MapReduce;Hbase;HDFS 中图分类号:TP391 文献标识码:A 文章编号:1005—3824(2014l04-0072-03 日志的分析和网页数据 的挖掘工作;淘宝的Hadoop 0 引 言 系统用于存储并处理电子商务交易的相关数据;中 随着电信企业的业务发展,其运营网络、业务系 国移动研究院基于Hadoop的 “大云”(bigcloud)系 统及支撑系统等产生了大量的日志数据,且这些数 统用于对数据进行分析并对外提供服务。 据以指数级增长。日志文件往往蕴含了大量有用信 1.2 Hadoop框架 息,对其进行分析和挖掘十分必要。例如,我们可以 Hadoop是 Apache下的一个开源框架,广泛应 从运营网络系统记录的日志数据,运用数据挖掘算 用于海量数据 的处理。Hadoop的核心 由HDFS和 法及时发现通信网络的潜在问题,从而为通信网络 MapReduce来体现。HDFS(Hadoopdistributedfile 的服务质量提供保障。传统基于结构化数据的分析 system)提供了一个稳定的文件系统,Hadoop的Ma- 处理方式不能满足 日志文件等半结构化及非结构化 pReduce模型在实时并行任务处理 的时候非常方 数据的分析处理要求…,而Apache的Hadoop平台 便,程序员只需要关注具体的数据分析任务,而不必 的出现,为这类问题的解决提供了新思路,作为一个 去考虑一些底层细节。。。一个HDFS集群 由1个称 比较成熟的框架 ,它已被广泛地应用到 日志分析 、网 为名称节点 (namenode)和数个数据节点 (data 络爬虫和科学计算等领域中,包括 Yahoo,Amazon node)这 2类节点构成,这 2类节点以管理者一工作 EC2和Facebook等大型的网站 。Hadoop平台借 者模式运行。名称节点负责维护整个文件系统。数 助于 MapReduce并行编程模型对海量数据进行处 据节点是文件系统中实际的工作者,它们提供存储、 理,并提供了底层封装、任务分配、并行处理和容错 定位块的服务,并定时向名称节点汇报存储块的信 等细节技术,用户只需集中注意力在 自身要解决的 息 。此外,Hadoop还提供一个分布式数据库 分布式计算任务本身,极大地简化了分布式程序设 (HBase)用来将数据存储或部署到各个计算节点 计 引。 上 。Hbase是一个分布式开源数据库,基于Ha
您可能关注的文档
最近下载
- 2025入团积极分子考试题库(含答案).pdf VIP
- 2024中职专业目录(新版).docx VIP
- 迪斯尼音乐厅的建筑与声学.pdf VIP
- 第6章空间力系分解.ppt VIP
- 2025年部编人教版(统编新教材)小学语文二年级上册教学计划及进度表.docx
- 2025年肺功能检查测试题及答案.doc VIP
- 2025年高考数学全国新课标Ⅱ卷试卷评析及备考策略(课件).pptx VIP
- 酒吧调研报告.pptx
- 第8课《回忆鲁迅先生》课件 (共45张ppt) 2025-2026学年统编版语文八年级上册.pptx VIP
- 2023版《思想道德与法治》(绪论-第一章)绪论 担当复兴大任 成就时代新人;第一章 领悟人生真谛 把握人生方向 第3讲 创造有意义的人生.pptx VIP
文档评论(0)