- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 网络信息内容的获取;目录 Contents;目录 Contents;受益于国际互联网基础设施建设的长足发展,当前基于互联网实现信息传播这一网络应用已经相当普及。有研究数据表明,截至2019年底全球域名保有量已超7690万。同时,2020年3月发布的第45次《中国互联网网络发展状况统计报告》[1]显示,到2019年12月域名注册者在中国境内的网站数为497万,网页总数达到2,978亿个,平均每个网站的网页数是59,926个,平均每个网页的字节数是70KB。 尽管容纳着数以万TB信息总量,并且正处于内容爆炸性增长的国际互联网包含琳琅满目、内容迥异的各式信息,但从宏观角度解读,网络公开传播的信息内容,可以分为网络媒体信息与网络通讯信息两大类型。;网络媒体信息定义 网络媒体信息是指传统意义上的互联网网站公开发布信息,网络用户通常可以基于通用网络浏览器(例如Microsoft的Internet Explorer,Netscape的Navigator,Mozilla的Mozilla Firefox)获得互联网公开发布信息。 宏观意义上的网络媒体信息涉及面广,可以通过网络媒体形态、发布信息类型、媒体发布方式、网页具体形态与信息交互协议等多种划分方法进一步细分与区别网络媒体信息的组成 。;1.网络媒体形态 按照网络媒体具体形态,网络媒体可以分为广播式媒体与交互式媒体两类。其中传统的广播式媒体主要包含新闻网站、论坛(BBS)、博客(BLOG)等具体形态;新兴的交互式媒体涵盖有哪些信誉好的足球投注网站引擎、多媒体(视/音频)点播、网上交友、网上招聘与电子商务(网络购物)等不同形态。每种形态的网络媒体都以各自方式向互联网用户推送其公开发布信息。 2.发布信息类型 从公开发布信息的具体类型上看,网络媒体信息可以细分为文本信息、图像信息、音频信息与视频信息等四种类型,其中网络文本信息始终是网络媒体信息中占比最大的信息类型。 3.媒体发布方式 按照网络媒体所选择的信息发布方式,网络媒体信息还可以分成可直接匿名浏览的公开发布信息,以及需实现身份认证才可进一步点击阅读的网络媒体发布信息。 ;4.网页具体形态 《中国互联网网络发展状况统计报告》[1]根据网页超链接网络地址(统一资源定位符,URL)的组成,将??页分成URL中不含“?”和输入参数的静态网页,以及URL中含“?”或输入参数的动态网页两类。 针对网页内容的具体构成形态,网络媒体信息中的静态网页与动态网页还可以进行更加明确地区分。 ;5.信息交互协议 按照所使用的信息交互协议的不同,网络媒体信息可以分为HTTP(S)信息, FTP信息, MMS信息,RTSP信息与已经不多见的Gopher信息等。其中,MMS信息与RTSP信息属于视/音频点播协议。当互联网用户通过网络浏览器点击MMS或RTSP协议信息时,浏览器会通过操作系统调用该协议解析所对应的默认应用程序,实现互联网用户请求的视/音频片段播放。;定义:网络通讯信息 互联网用户使用通用除网络浏览器以外的专用客户端软件,实现与特定点通信,或进行点对点通信时所交互的信息属于网络通讯信息。 常见的网络通讯信息包含使用客户端软件(例如Microsoft Outlook,Foxmail等)收发电子邮件,基于即时通信软件进行网上聊天,采用金融机构发布的客户端进行网上财经交易等;;目录 Contents;与面向特定点的网络通讯信息获取不同,网络媒体信息获取环节的工作范围理论上可以是整个国际互联网。 理论上网络媒体信息获取流程主要由初始URL集合——信息“种子”集合,等待获取的URL队列,信息获取模块,信息解析模块,信息判重模块与互联网信息库共同组成,如图3-4所示。 ;1.初始URL集合 概念最初由有哪些信誉好的足球投注网站引擎研究人员提出,商用有哪些信誉好的足球投注网站引擎为了使自身拥有的信息充分覆盖整个国际互联网,需要首先维护包含相当数量网络地址的初始URL集合。有哪些信誉好的足球投注网站引擎跟随初始URL集合发布页面上的网络链接进入第一级网页,并进一步跟随第一级网页内嵌链接进入第二级网页,最终形成周而复始地跟随网页内嵌地址的递归操作,完成所有网页发布信息的获取工作。 因此初始URL集合通常被形象地称之为信息“种子”集合,如图3-5所示。 ;2.信息获取 信息获取模块首先根据来自初始网络地址集合或URL队列中每条网络地址信息,确定待获取内容所采用的信息发布协议。在完成待获取内容协议解析操作后,信息获取模块基于特定通信协议所定义的网络交互机制,向信息发布网站请求所需内容,并接收来自网站的响应信息,传递给后续的信息解析模块。 基于HTTP协议发布的文本信息获取范例如图3-6所示,HTTP信息网络交互过程细节,可查阅协议规范Hypertext Transfer Protocol-HTTP/1.1 [3]。;3.信息解析 在信息获取模块获得网络媒
您可能关注的文档
- 信息技术基础-Office-2010实用案例教程教学课件-第3章职业生涯规划文档制作.pptx
- 信息检索与运用PPT课件(共8章)第三章-淡墨留香的知识典藏---纸质文献检索.pptx
- 信息内容安全管理及应用教学课件(共12章)第1章.pptx
- 信息内容安全管理及应用教学课件(共12章)第2章.pptx
- 信息内容安全管理及应用教学课件(共12章)第11章信息过滤.pptx
- 信息内容安全管理及应用教学课件(共12章)第12章.pptx
- 信息内容安全管理及应用教学课件(共12章)第八章基于深度学习的图像处理.pptx
- 信息内容安全管理及应用教学课件(共12章)第九章深度网络自然语言处理.pptx
- 信息内容安全管理及应用教学课件(共12章)第六章图像处理特征抽取.pptx
- 信息内容安全管理及应用教学课件(共12章)第七章信息处理模型和算法.pptx
- 信息内容安全管理及应用教学课件(共12章)第十章在线社交网络分析.pptx
- 信息内容安全管理及应用教学课件(共12章)第四章文本信息特征抽取.pptx
- 信息内容安全管理及应用教学课件(共12章)第五章音频数据处理.pptx
- 信息社会责任概念介绍.pptx
文档评论(0)