国家图书舆情监测系统功能需求书.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
国家图书舆情监测系统功能需求书

国家图书馆舆情监测系统功能需求书 一、前言 舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。网络舆情是社会舆情在互联网空间的映射,是社会舆情的直接反映。 随着互联网络在全球范围内的飞速发展,网络新闻媒体已被公认为是继报纸、广播、电视之后的“第四媒体”。 网络技术推陈出新,网络新闻、论坛、博客、聚合新闻等范围广、交互性强、更新速度快,任何人都可以在 BBS 论坛,留言版或者自建站点上发布言论和观点,Web2.0的发展与广泛应用,互联网上的舆论信息迅速传遍。从对社会影响,网络舆论成为社会舆论的一种重要表现形式。现在,要了解必威体育精装版、最快的国内外大事,媒体。与其它媒体相比,网络除了即时、海量等优势外,还具有互动的功能。一则新闻后,马上可以从新闻留言中得知。这些特点,使网络媒体的受众越来越多,覆盖面越来越广,影响力越来越强。在这种情况下,网络舆论主流舆论, 中共中央政治局 1 月 23 日进行第三十八次集体学习,胡锦涛总书记就加强网络文化建设和管理提出五项要求。其中第三项要求,要加强网上思想舆论阵地建设,掌握网上舆论主导权,提高网上引导水平,讲求引导艺术,积极运用新技术,加大正面宣传力度,形成积极向上的主流舆论。 舆情监测系统流程示意图 系统的各业务流程描述如下: 1、舆情规划与定向 包括采集目标的规划、系统分类的规划以及系统权限(用户、角色)的规划。 2、舆情信息采集和存储 整合多种信息源,包括互联网通用信息的收集、互联网验证信息的收集、互联网论坛信息的收集、互联网博客信息的收集、有哪些信誉好的足球投注网站引擎检索后的数据收集、用户手工录入信息的收集。信息收集过程中利用自然语言等技术初步筛选、查重去重、自动摘要、自动分类进行处理,去掉大多数系统不关注的信息。 3、舆情信息加工 舆情工作人员通过工作平台系统的WEB界面,进行信息筛选、编辑以及加工整理,将处理后的信息从原始信息库加入到舆情信息库;通过发布操作将舆情信息库中的信息发布到系统服务平台上。 4、舆情分析和处理 将检索到的文档进行关联操作以生成舆情报告,也可以直接检索文档来生成报告,报告在发布之后存储在舆情信息库中,可以经过进一步加工,发布到舆情服务门户中去。另外,也可以根据实际需要实现舆情热点、频点、传播趋势分析。 5、舆情服务 以各种适当的方式包装舆情情报产品,及时传送给相关决策领导,并为以决策层为主的员工提供快捷友好的多途径检索、舆情推送定制、邮件订阅等分层次舆情情报服务。 五、系统各模块功能设计 系统包含四大功能模块:互联网舆情信息采集和存储、舆情智能分析、舆情服务和系统管理。 (一)、互联网舆情信息采集和存储 1 网络信息采集架构和组成 舆情关注的信息在互联网上的存在分散,并且形式多样,有网页(包括网友匿名评论)、论坛、博客等各种形式。本项目设计的网络采集主要包括两部分:一是采集论坛、博客、网页的网页采集模块;二是采集百度、Google生成页面的有哪些信誉好的足球投注网站引擎采集; 1.1 网页、论坛、博客的采集 多线程实时监测和采集目标网站的内容,对采集到的信息进行过滤和自动分类处理,最终将必威体育精装版内容及时发布出来,实现统一的信息导航功能,或者将采集过来的信息送入内容管理平台供监测人员服务。 采集模块允许用户任意定义目标收集网站,实现实时信息采集,信息的自动分类、去重、标引、入库和发布。 系统是以网页采集为主线,将各项关键技术无缝集成在系统内部,自动完成从采集到各项加工处理功能,最终生成满足应用要求的数据信息。 网页采集除采集新闻内容主体外,还需要采集对新闻的评论、跟帖等,同时将新闻主体和相关的评论、跟帖建立联系,分别储存 论坛采集除采集主贴外,同时要采集跟帖并建立联系,分别储存 博客采集除博文外,同时要采集对博文的相关评论并建立联系,分别储存 采集策略 系统提供完善、全面而且可配置的采集策略,如下: 提供灵活的定制设置目标网站功能,实现对目标网站的实时监测和内容采集,灵活设置采集网站、采集频道/栏目、采集页面、采集深度等; 提供采集源定义功能,可以按网站名和频道名来采集资源,使来源属性更为准确; 系统可以方便设定信息监测的时间周期,灵活的设定两次资源更新之间的时间间隔; 可以设置灵活的对表格内容与图片资源的采集策略; 提供精确采集处理策略,如引入日期变量、页码变量与数字变量,使用户可精确定位带有日期、翻页或一定数字规则信息的栏目或频道; 提供先进高效的信息更新处理机制,只采集实时更新过的网页资源,保证对采集过的信息不会重复采集; 系统需采用多线程并发有哪些信誉好的足球投注网站技术,支持设置多类别对多站点同时并发采集;系统需采用先进高效的采集技术,采集过程需高效准

文档评论(0)

jiaoyuguanliji + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档