Web信息检索技术.pptxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web信息检索技术

Web信息检索技术主讲人: 杜 蕾 联系方式:dulei_hd@163.com20010年8月-11月写在授课之前授课学时实验学时- 30 学时- 10学时Quiz下面场景中,按回车键,会发生什么?浏览器地址栏里输入/之后Google有哪些信誉好的足球投注网站框里输入”黑龙江大学”之后本课程的内容(1)信息及信息资源 信息检索概述信息检索模型信息检索评价检索的改进技术本课程的内容(2)文本分类和聚类信息过滤Web信息检索基于内容的图像及音频检索问答系统及自动文摘信息及信息资源信息的涵义信息的种类、特征信息资源电子信息资源电子信息资源的特征、类型信息检索概述概念及意义体系结构研究现状及发展趋势相关领域主要有哪些信誉好的足球投注网站引擎分类与评价信息检索的应用信息检索模型布尔模型向量空间模型(VSM)概率模型信息检索评价相关性问题信息检索性能评价信息检索性能评价指标信息检索评价试验平台TREC检索的改进 词(Term)处理Stemming(词干提取)技术,词法分析、形态还原,停用词表的构建,语义词典的构建,分词、词性标注和词义消歧等索引技术倒排文档(Inverted List),Signature文件,PAT树等提问(Query)处理提问理解,提问的语义扩展(包括基于局部聚类的提问扩展,基于局部上下文分析的提问扩展,基于相似语义词典的提问扩展,基于统计词典的语义扩展)相关反馈(包括Term权重的重新计算,相关反馈策略的评价等)文本分类和聚类特征词抽取TFIDF信息增益方法文本表示文本相似度计算文本分类算法文本聚类算法文本过滤 过滤系统中的Profile的表示及管理各种匹配算法Brute Force算法Knuth-Morris-Pratt算法Boyer-Moore算法Karp-Rabin过滤系统在信息安全中的应用Web信息检索Web检索的历史及现状Web Information Discovery 有哪些信誉好的足球投注网站技术(Crawling)排序算法PageRankHitsWeb Noises Detection *基于内容的图像及音频检索*图像的特征表示图像相似度计算相关反馈基于音频的信息检索计算*问答系统及自动文摘* 问答系统问题的理解及分类转述(Paraphrasing)答案抽取问答式信息检索的应用自动文摘自动摘录基于理解的自动文摘基于信息抽取的自动文摘基于篇章结构的自动文摘 课程目的发现了什么问题?Web信息的数量,内容丰富程度(庞杂)↑ 人们访问信息的效率↓课程目的介绍面对web信息过载问题挑战的各种研究和尝试,具体为大规模Web信息搜集、分析及处理方法与技术认识这个激动人心领域的导论研究对象——Web1980年Tim Berners-Lee负责的Enquire(Enquire Within Upon Everything的简称)项目。1990年11月,第一个Web服务器nxoc01.cern.ch开始运行,Tim Berners-Lee在自己编写的图形化Web浏览器“WorldWideWeb”上看到了最早的Web页面。1991年,CERN(European Particle Physics Laboratory)正式发布了Web技术标准。目前,及Web相关的各种技术标准都由著名的W3C组织(World Wide Web Consortium)管理和维护。 Web的支撑技术用超文本技术(HTML)实现信息及信息的连接用统一资源定位技术(URI)实现全球信息的精确定位用新的应用层协议(HTTP)实现分布式的信息共享。这三个特点无一不与信息的分发、获取和利用有关。Tim Berners-Lee说:Web是一个抽象的(假想的)信息空间。也就是说,作为Internet上的一种应用架构,Web的首要任务就是向人们提供信息和信息服务。 Web技术的发展客户端技术GIF第一次为HTML页面引入了动感元素 JavaApplets和JavaScript的支持 CSS(Cascading Style Sheets)和DHTML(Dynamic HTML)技术 插件、ActiveX控件技术服务端技术CGI允许服务端的应用程序根据客户端的请求,动态生成HTML页面,动态信息交换Perl ,PHP 、ASP 、JSP 企业级开发平台--J2EE和.NET Web增长Load on the first Web server (info.cern.ch) 1000 times what it has been 3 years earlier Web增长网站数目↑ ↑ ↑1993-1996, from 130 to 600.000 sitesNetcraft said that it has counted 85,541,228 websites at the beginning of 2006/06, The

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档