王斌老师现信息检索2012年秋季期末试题.docVIP

王斌老师现信息检索2012年秋季期末试题.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国科学院研究生院课程编号:71258-Z-2试 题 专 用 纸课程名称:现代信息检索任课教师:王斌 ———————————————————————————————————————————————姓名学号成绩判断题(正确打√,错误打X。每题2分,共分)γ的编码序列 。 A)B)C)D) 2.的是。 A)B) C)D) 共5页第1页3. 。 A)B) C)D). 。 A)B) C)D) 5. A)B) C)D) 6.。 A)B)C) 7. 。 A)B)C)D). 。 A)B)C)D)Rq1={d1,d2,d3,d4,d5}及 Rq2={d6,d7,d8,d9,d10 }的查询q1、q2,某个检索系统A返回的检索结果如表1所示。试计算出该系统对每个查询的P、R、F、P@10、AP等指标,并计算整个系统的MAP指标。请写出计算过程并将最后结果汇总填入表2中(小数点后保留2位即可)。其中AP计算采用未插值方法。 表1 检索结果表 系统-查询 返回结果数 返回结果中正确答案所在位置 A-q1 20 2-d2; 4-d4;5-d1;10-d5 A-q2 20 1-d6,4-d7;10-d8;12-d9共5页第2页 表2 结果汇总表 系统查询 P R F P@10 AP MAP A-q1 0.2 0.8 0.32 0.4 0.4 0.413 A-q2 0.2 0.8 0.32 0.3 0.427对于下列分别采用VB编码和γ编码的间距编码结果(第一个是原始值,后面为间隔值),请还原原始的间距序列及倒排记录表。 VB编码101110000010110110110101 γ编码: 0010110 (110111000 100101010010110110110101 2872 21 738997 2872 2893 741890 (2)11001 11 0111 1110110 101 5 1010111 87 199 1110 14 5 92 291 295 对于如下坐标轴上的点,请分别采用单连接、全连接和质心法HAC对这些点进行聚类,并输出聚类的树状图 单连接、全连接和质心法HAC 最相似成员 最不相似成员 平均相似度假设个网页A、B、C、D构成如下的链接关系,试采用如下公式(u指当前页面,Bu是所有链接到u的页面集合,Nv是页面v的总出链接数,Ru)和Rv)分别是u和v的PageRank值,为计算方便,假定c=)计算每个网页的归一化PageRank值,即个网页的PageRank总和为1。 ( 我 是 中国 人”,中文分词可以采用无事先定义词典的方法。试应用本课程学到的文本分类技术实现无词典的分词过程,给出你的思路的详细步骤(内容抽取到文本分类问题的映射、文本表示方法、特征选择及分类算法等)和过程(提示:尽量详细)。 从发表内容和关注关系(结构)两个角度出发,设计一个算法来计算微博用户之间的相似度(提示:尽量详细)。A B E C D

文档评论(0)

enxyuio + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档