- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Hadoop 的城市道路交通流量数据分布式存储与挖掘分析研究精选
基于Hadoop 的城市道路交通流量数据分布式存储与挖掘分析研究 Distributed Storage And Mining Analysis Research Of Urban Road Traffic Flow Data Based On The Hadoop Liao Fei1Gong Dejun1,2 An Le2 Abstract Faced with huge and rapidly growing urban road traffic flow data, in order to deal with faststorage to huge traffic flow data and mining analysis it efficiently. Use HBase distributed database based on Hadoop to store the collected urban road traffic flow data, and then use Hadoop efficient parallel MapReduce computing programming model to deal with mass data mining analysis of urban traffic flow data. In the experiment, and achieved ideal results, based on Hadoop is verified in the storage and processing of urban road traffic flow data is more efficient than the traditional way, and has great application prospect. Key words trafficflow;Hadoop;HBase;mass data processing;parallel computing; mining analysis 引 言 随着人们生活水平的提高,城市汽车拥有量快速增加,城市道路交通流量急剧增长,交通堵塞、交通事故、交通违法等交通问题日渐显著。面对如此巨大而且快速增长的城市道路交通流量数据,如何快速存储、灵活扩展存储容量,采用何种科学、有效的数据挖掘手段对海量的交通流量数据进行分析研究,是城市交通领域的一大难题。 本文研究基于Hadoop中HBase分布式数据库来存储每一时段采集到的城市道路路段交通流量,实现海量数据的高速存储,并具有无限的扩充能力,采用Hadoop高效并行计算MapReduce编程模型对海量的城市交通流量数据进行数据挖掘分析,得到每一时刻、每天、每月的城市各路段交通流量统计分布情况,为城市路网规划、城市交通管理与控制提供依据,为交通研究、交通规划设计、交通管理部门提供决策支持辅助,对缓解城市交通问题具有一定的促进作用。 Hadoop的整体架构 Hadoop是Apache软件基金会的开源分布式计算框架,在众多大型企业都有成功的应用案例。Hadoop实现了MapReduce并行编程模型,提供了分布式文件系统HDFSHadoop Distributed File System,简称HDFS,为分布式计算提供底层存储支持[1][2]。Hadoop在可扩展性、高效性、易用性、经济行、可靠性等方面具有很强的优势[1][2]: Hadoop主要的组成项目包括Hadoop Common、Avro、MapReduce、HDFS、ZooKeeper、Pig、Chukwa、Hive、HBase等子项目,具体如图1所示。 图1 Hadoop相关项目成员 Fig.1 Hadoop Related Project Member 总体架构 从交通流量数据自身实际特点,基于Hadoop设计了城市道路交通流量数据分布式存储与挖掘的总体架构。该总体架构如图2所示,自下而上包括四个层次,主要由数据采集层、数据存储层、挖掘分析层、应用服务层构成,在本文中,数据存储层与挖掘分析层是研究的重点。 图2 总体架构 Fig.2 Overall Architecture 数据采集层 交通流数据的采集主要通过部署在各个路段的感应线圈来获得,并把获得的数据传输给数据采集系统,然后把数据汇总定期通过并行存储编程接口写入到分布式数据库中。采集到数据包含车牌号、车辆型号、行驶方向、驶入时间等信息。 2.2 数据存储层 数据存储层主要通过MapReduce数据并行存储编程模型把数据批量地写入HBase分布式数据库中,而写入的数据主要存储在Hadoop计算机集群中。该层中的计算机集群采用经典的主/从部署架构,也叫Mast
您可能关注的文档
- 城市交通环境问题调查报告精选.doc
- 地铁消防与反恐安全知识讲座_图文精选.ppt
- 城市交通拥堵问题的分析与治理精选.doc
- 城市住房价格波动差异及连锁反应研究精选.doc
- 城市交通管理及改革毕业论文精选.doc
- 城市三级医院对口支援县医院考核-副本资料精选.ppt
- 城市光纤接入网的规划设计(City planning and design of optical fiber access network)精选.doc
- 垃圾分类班会课件[公开]精选.ppt
- 城市公交管理规范精选.doc
- 城市公共交通管理国内外研究现状和发展趋势精选.doc
- 基于J2EE Struts框架的课程设计实训项目——《BBS论坛系统》——业务层中的BBS信息管理组件的功能实现及对应的单元测试用例(第1部分)精选.doc
- 基于GSMGPS的汽车防盗报警系统的设计本科毕业论文(设计)精选.docx
- 基于J2EE Struts框架的课程设计实训项目——《BBS论坛系统》——业务层中的用户信息管理组件的功能实现及对应的单元测试用例(第1部分)精选.doc
- 基于Android开发多媒体播放器Multimedia Player develops base on精选.ppt
- 基于J2EE Struts框架的课程设计实训项目——《BBS论坛系统》——实现BBS信息管理的DAO组件及对应的单元测试用例精选.doc
- 基于J2EE架构的层次结构研究及应用精选.doc
- 基于J2EE框架与SAS组件的航空公司客户关系管理分析系统的设计与实现精选.doc
- 基于InfoPath的通用表单采集解决方案精选.ppt
- 基于JAVA EE的电子商务系统的设计与实现精选.doc
- 基于J2EE的停车场管理系统的设计与实现毕业论文精选.doc
文档评论(0)