- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第7章检索系统评价
本章内容 检索系统评价的基本概念和类型 性能评价指标和评价方法 主要的测试集 评价方案的设计与实施 课堂作业 Consider an information need for which there are 4 relevant documents in the collection. Contrast two systems run on this collection. Their top 10 results are judged for relevance as follows (the leftmost item is the top ranked search result): 1?RNRNN?NNNRR 2?NRNNR?RRNNN What is the MAP of each system? Which has a higher MAP? Does this result intuitively make sense? What does it say about what is important in getting a good MAP score? What is the R-precision of each system? (Does it rank the systems the same as MAP?) 1、相关性范畴概念理论 相关性范畴是按照检索结果同检索课题的相关程度,把检索结果分别归入四个范畴。 就是多值相关性判断 范畴0:重复链接、死链和不相关联链接 范畴1:技术上相关,但与用户需求没有相关性 范畴2:潜在有用的链接,或者给出指向属于范畴 3的链接 范畴3:十分有用的链接 3:评级方案的设计 4:评价方案的实施 步骤: (1)取样, (2)测试, (3)数据收集与纪录, (4)数据处理与分析, (5)评价结果分析与解析 前X命中记录查准率 用来反映检索系统在前X个检索结果中向用户提供相关信息的能力 P(20) 看前20条记录中向用户提供相关信息的能力。 怎么做呢? 教材202页。 ? 用所有有哪些信誉好的足球投注网站引擎得出的检索结果之和? 数据库规模与内容:收录范围、重复率、死链接等。 索引方法:索引方式、索引范围与深度 检索功能:基本检索功能 高级检索功能 检索结果的处理:排序、显示内容和格式等 分类功能 用户界面 (一)问题的提出 分析实际检索系统往往很难,因此通过标准定制的数据来进行性能评价,也就是说通过给定一定的文献、提问式和相关性判断来进行评价。 一个好的试验样本应该包括: (1 )一组标准的文献和提问式 (2 )每一个提问式对应的相关文献集合 1Smart collection: /pub/smart 2TREC: / 3CF collection 4国内863项目 为了对SMART测试项目所做的一个小规模的测试集. (/pub/smart) Collection Name Number of Document Number of Queries Raw Size (Mbytes) CACM 3,204 64 1.5 CISI 1,460 112 1.3 CRAN 1,400 225 1.6 MED 1,033 30 1.1 TIME 425 83 1.5 (1)什么是TREC 文本检索会议,一开始是由国防部高级研究计划署资助的TIPSTER项目发起的。从1992年起每年举办一次,由美国国家标准技术组织和DARPA联合举办。参加者会得到用于培训和测试用的一系列的标准文献和提问,然后在会议上交流结果。 TREC: Text REtrieval Conference (/) 1为比较不同的检索技术提供了共同的基础。(相同的文献、相同的提问和相同的评价方法) 2分享和交流发展样本的资源和经验。 (资助主要来自政府) 3鼓励产业界和学术界的参与 4发展新的评价方法和技术,特别是评价新的检索系统的方法和技术。如网络检索、非英语系统、问答式系统等。 1 规模大 Large scale (compared to a few MB in the SMART Collection). 2 提供了相关性判断 Relevance judgments provided. 3 美国政府的大力资助 Under continuous development with support from the U.S. Government. 4 参加者广泛 Wide participation: TREC 1: 28 papers 360 pages. TREC 4: 37 papers 560 pages. TREC 7: 61 papers 60
您可能关注的文档
- 第7章 轴设计计算.ppt
- 第7章 金融系统中金融机构.ppt
- 第7章 综合布线系统测试.ppt
- 第7章-03 Linux常用命令 [自动保存].ppt
- 第7章-地形图测绘及应用.ppt
- 第7章__AT89S51单片机及数码管、键盘接口.ppt
- 第7章RFID系统的关键技术之防碰撞机制分析及实现.ppt
- 第7章_汇编语言及C/C++的混合编程.ppt
- 第7章_波形显示及测量(电子测量技术课件).ppt
- 第7章GPS定位基本原理.ppt
- 2025年中国乙氧苯柳胺软膏市场调查研究报告.docx
- 2025年及未来5年电信设备项目市场数据调查、监测研究报告.docx
- 2025年中国产宝口服液市场调查研究报告.docx
- 2025年及未来5年远红外线热敷按摩仪之瑞颈灵项目市场数据分析可行性研究报告.docx
- 2025年中国2—氨基—4,6—二氯嘧啶市场调查研究报告.docx
- 2025年及未来5年双层风琴帘项目市场数据调查、监测研究报告.docx
- 2025年及未来5年多功能短路定位分析仪项目市场数据调查、监测研究报告.docx
- 2025年中国换芯型烟嘴市场调查研究报告.docx
- 2025年及未来5年印章防伪项目市场数据调查、监测研究报告.docx
- 2025年中国超小型冷冻修边机市场调查研究报告.docx
最近下载
- 超声科院感自查问题及整改措施记录.docx
- 土地整理用施工月报_新.pdf VIP
- U8 cloud 操作手册(资产管理)-资产信息管理.pdf VIP
- 2025年宪法知识竞赛试题(附答案).docx
- 模块化构建的MICROMINE软件培训教程(史上最全).pdf VIP
- 北京朝阳人大附朝阳分校2025届数学八年级第一学期期末经典试题含解析.doc VIP
- U8 cloud 操作手册(财务管理)-报销管理.pdf VIP
- 2024年江苏省建湖县文化馆公开招聘试题带答案详解.docx VIP
- 城市公园智慧化生态监测系统2025年环境监测技术升级报告.docx
- 静水压强的测算静水压强与静水压力计算.ppt VIP
有哪些信誉好的足球投注网站
文档评论(0)