2013广联达建设行业年度峰会行业管理信息化主题分享之《挖掘数据价值 共享信息辉煌——基于大数据的工程数据研究》.pdfVIP

2013广联达建设行业年度峰会行业管理信息化主题分享之《挖掘数据价值 共享信息辉煌——基于大数据的工程数据研究》.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2013广联达建设行业年度峰会行业管理信息化主题分享之《挖掘数据价值 共享信息辉煌——基于大数据的工程数据研究》

建筑市场与招标投标 5/2013 2013广 挖《掘数据价值 广联达软件股份有限公司造价信息事业部总经理 付永晖 尊敬的各位领导、各位嘉宾: 的颗粒度越来越小,我们挖掘信息的价值就越来越 下午好!非常高兴在这里和大家一起交流! 大,怎么分析和挖掘,这也是摆在我们面前的难题。 我今天主要讲五方面的内容。 一个是大数据 我们看一下工程数据应用的挑战。目前海量数据 的机会,一个是工程数据应用的挑战。我们做工程 处理困难,分析模型算法复杂等等,如果用一套完整 数据的应用过程中发现有很多的问题 ,不用不知 的项 目工程文件,就是一个计价文件,按照某一个房 道 ,一用吓一跳。第三,工程数据标准的建立,这 地产公司,比如万科的,他所设定的一个指标分析表 在实际的数据应用过程中需要建立标准。还有应用 格,他这条表格分析出来他的指标,那么大概需要两 的实践,我们数据挖掘的过程 中用到的实际的技 周时间,就一个资深的工程师拿完整的工程数据分析 术 ,这个技术我个人认为,可能会带来整个行业在 出一套完整的指标表格需要两周时间,如果用金钱衡 信息化的突破和变化。现在是一个大数据时代,每 量的话,一个工程分析成—个指标,大概需要上千块 天产生海量的信息,这些在网上都可以看到,包括 钱,所以成本及其昂贵。在这个过程中主要有这么几 在座的每一位,坐在这里的时候,就产生各种各样 个困难,我们虽然有大量的信息,包括造价站、标办, 的信息,微信微博邮件,都是信息,这些信息的背 包括中介公司有大量的信息,但是这些信息是非常不 后是巨大的信息财富,只是这个财富如何被利用出 规范的,因为我们造价人员做预算的过程中,他的工 来,这个需要我们计算机和行业的专家共同研究。 作 目标并不是这样,他可能不会按照我们的标准做预 在这个过程中,除了信息以外,我们以前的信 算,他会按照怎么快怎么准确做预算,这些预算产生 息只是文本信息,很简单的结构化信息,现在的信 的数据工程文件,我们如何拿来做详细的指标分析? 息是非常复杂的信息,我们以前的信息只是文本, 所以说,是先做标准还是先做工作?我先建立一套预 现在有图片、声音、文字,还有流媒体,等等一系 算标准,你按我的标准做预算,还是我先把预算做 列的信息都已经出现,包括我们的工程造价的工程 完?所以原始工程部规范,特征描述不完整,分析标 文件,计价文件,等等都是非常复杂的信息,这些 准不一致,没有好的分析工具。而且还没有好的工具, 信息其实很多是非结构化的信息,这些信息如何利 我们现在90%以上是靠Excel表格做工具,这个是非 用也是摆在我们面前的很重要的技术难题。所以 常原始的。 说,在整个的过程中有四个阶段,我的数据不断的 我们首先要建立标准,作为一个企业的指标体 扩充的情况下,怎么把这些数据搜集回来,以前是 系,我们认为有三个重要的关键 ,—个是工程分类 靠人工,我们的材料信息,我们造价站,我们的政 体系,这个国家已经有标准了,但是在这个体系之上 府有很多的信息,这些信息能有多少,我估计有上 的工程特征描述体系,工程指标项体系没有,如何建 万条信息,但是整个行业可能有几千万条信息,这 立这套系统。我们用了两年的时间,做了两类专业标 个靠人工是很难收集的,收集信息完了以后 ,这些 准,这是我们建立起来的分类体系,一级二级三级的 非结构化的信息如何变成结构化,如何按照材料编 分类体系,包括特征描述体系,等等。目前,我们建 码的规则,我们知道研究材料编码标

文档评论(0)

118zhuanqian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档