数据管理前沿技术报告.PDF

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据管理前沿技术报告

数据管理前沿技术报告 - 6 - - 7 - 社会计算研究进展 在线用户行为演化研究① 李 勇 孟小峰 中国人民大学信息学院 WAMDM 实验室,北京,100872 物联网、云计算、社交网络、社会媒体以及信息获取技术的飞速发展,数据正以前所未 有的速度迅速增长和积累,大数据时代的到来,为研究人类社会动态和模拟社会问题带来了 前所未有的机遇。计算机科学家、社会学家等各领域学者开始关注大数据对社会、经济、科 学研究等带来的巨大价值。美国圣塔菲研究所(Santa Fe Institute)、谷歌研究院(Research at Google)、惠普社会计算实验室(HP Social Computing Lab)等跨学科研究机构和哈佛、 斯坦福、康奈尔等大学,开始用复杂性科学来描述社会系统中的复杂现象,提出了复杂适应 系统等一系列新理论,以计算机作为研究复杂性科学的基本工具,开创了“计算社会科学” 等新的研究方法,社会计算开始进入人类社会。 本文在中国人民大学重大基础研究基金“社会计算若干关键问题研究”项目的支持之下, 从中国互联网络信息中心(CNNIC)获得在线用户行为大数据,以跨学科的社会计算为研究范 式,研究人类在线行为动力学规律,在社会计算研究范式的哲学探讨和跨学科思维模式的应 用的基础上,探索在线用户行为的普适模式和规律。本文的结构为:第1节介绍社会计算的 核心概念与研究范式;第2节介绍本文研究的数据来源及特征;第3节介绍发现的在线用户兴 趣的长程演化规律;第4节介绍在线用户集体注意力流在Web演化中的推动作用,并提出了 一个比超链接算法(如PageRank)更有效的Web站点排名算法;第5节介绍在线用户集体注 意力流与Web演化的普适模式;第6节总结。 1 社会计算概论 1.1 跨学科研究概论 自然科学、社会科学和人文科学只是学术建制意义上的区分,它们之间总是密切联系。 自然科学的根本目的在于发现自然现象背后的规律,20世纪50年代之前,社会科学与自然科 学相对独立,跨学科研究较少。如图1所示,社会科学与自然科学由一条学科河分隔,河的 左岸是以科学计算为核心研究范式,以系统科学、控制论、人工智能等作为研究方法的自然 科学;右岸是心理学、经济学、传播学、社会学、政治学等社会科学。 20世纪70至90年代,人类进入后工业化时代,信息革命改变了一切,经济、政治、文化 的全球化融合达到新的阶段,科学发展变得越来越快,越来越复杂。大工业和高科技为人类 创造了非常丰富的财富,但同时也把人与自然的关系、人与人的关系置于一个危险的境地, 社会不平等、阶级冲突、社会异化、种族冲突、政治革命、宗教冲突、国家冲突、环境恶化 等社会问题突出,人类越来越重视对自身前途与命运的价值关怀。为了准确地研究社会问题, 经济学、社会学等学科都试图形成一套完整的定量分析研究手段,用严谨的数学方法对问题 进行描述和求解,但由于现实世界是一个多变量复杂系统,很难像物理学那样用数学公式精 确地描述和求解问题。在这种共同的背景下,自然科学、社会科学开始走到一起,任何一门 科学都开始意识到自己的相对性,意识到与其他学科密切关联。如图1所示,建立在自然科 学与社会科学之间,位于学科河之上的跨学科社会计算研究逐渐兴起,这些学科都有数据密 集型的特点,包括社会网络分析、计算社会科学、社会控制论等。 ???????????????????????????????????????? ????????????????????? ①本文是中国人民大学重大基础科学研究基金项目“社会计算若干关键问题研究”(编号:11XNL010,2011-2016)阶段性研究成果。节选自中国人民大学博 士学位论文“在线用户行为演化研究”。 - 8 - 社会科学与自然科学本质区别在于思维方式的不同,社会科学是总体逻辑思维,自然 科学是类型逻辑思维。类型逻辑思维认为应该重点关注典型现象,只要理解了典型现象的规 律,就可以将其概括并推广到个体和具体问题。总体逻辑思维关注独立各异个案的整体分布, 社会科学认为变异是社会现实的本质,社会学家的工作就是从变异中寻求规律,以经验为基 础、以量化为导向地去概括总体变异的系统模式,社会科学的量化无法挖掘出普适规律来描 述和解释所有个体行为。正是因为思维方式的不同,社会科学与自然科学之间的壁垒仍然难 以逾越,社会学家批评技术学派所作的社会计算研究缺乏理论指导,技术学派认为社会科学 研究所用数据规模太小不可信任。为社会计算提出跨学科的协作与训练、提出学科间统一的 理论指导是当前最大的挑战。 正是

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档