- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国科技论文在线 延迟反序列化:一种提升MapReduce 程序 性能的方法 黄佳* 5 (北京邮电大学计算机学院,北京 100876 ) 摘要:基于Hadoop 提供的MapReduce 并行计算框架,用户可以方便地实现并行计算。通常, 用户在MapReduce 程序中将输入数据解析成为由特定分隔符分隔的字符串,反序列化和序 列化的代价过大,同时,计算过程中数据类型的转换也会产生额外的开销。本文通过将一种 延迟反序列化技术整合到MapReduce 程序中,实现了MapReduce 程序计算性能较为明显的 10 提升。该技术的核心在于只在必要的时候才将记录中特定的字段反序列化为相应的Java 对 象。 关键词:计算机应用;Hadoop ;MapReduce ;反序列化 中图分类号:TP391 15 Lazy Deserialization :A way to improve the performance of MapReduce Huang Jia (School of Computer Science, Beijing University of Posts and Telecommunications, Beijing 100876) 20 Abstract: MapReduce, a parallel computation frame that is based on High-availability distributed object-oriented platform (Hadoop), could be used to provide convenient parallel computations. In general, the input record is parsed into a string separated by specific separators in the MapReduce. The cost of the deserialization and serialization procedure, in terms of run time, is high. In addition, the format conversion in the computation requires extra run time cost. In this paper, we propose a method 25 to integrate the Lazy Deserialization technique to the MapReduce program, which could significantly improve its performance. The key point is to deserialize the fields of record into corresponding Java objects only when it is necessary. Key words: Computer Application Technology;Hadoop;MapReduce;Deserialization 30 0 引言 信息爆炸式增长,迫切要求企业能及时、准确地处理海量数据,同时,要求数据处理系 统能够有很好的可扩展性。 [1]Hadoop 是一个能够对大量数据进行处理的分布式系统基础框架,具有可靠、高效、 可伸缩的特点,同时,因为它依赖于社区服务器,所以还具有低成本的特点,另外,Hadoo
您可能关注的文档
最近下载
- 英语16时态讲解.doc VIP
- 检验科微生物实验室生物安全事件应急预案实.docx VIP
- 中国人寿:养老险总公司招聘笔试题库2023.pdf
- 申论规范词1000条【2024版】.pdf VIP
- 2025年《高速铁路概论》课程考试题库(含各题型).docx VIP
- 多腐蚀交互作用下的管道失效压力计算模型研究.docx VIP
- 10.1.1酸碱指示剂和常见的酸 课件(共31张PPT)初中化学 人教版 九年级下册(含音频+视频).pptx VIP
- 2025必威体育精装版国企笔试题库与答案.docx VIP
- 斐波那契数列和黄金分割.pptx
- 2025年全国特种设备安全管理人员A证考试练习题库(1000题)含答案.pdf
文档评论(0)