TPI异构统一检索系统的信息检索方法与策略.pdfVIP

TPI异构统一检索系统的信息检索方法与策略.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
TPI异构统一检索系统的信息检索方法与策略

维普资讯 Vo1.28,No.5 HeilongjiangElectricPower Oct.20O6 TPI异构统一检索系统的信息检索方法与策略 解忠武 (黑龙江省电力科学研究院,黑龙江 哈尔滨150030) 摘 要:介绍了异构检索的基本原理、黑龙江省电力科技数字化信息平台上异构数据库的配置和用于全文检索 的分词策略。论述了异构统一检索的基本方法和策略,阐述了检索过程中的注意事项。 关键词:异构检索;检索策略;检索方法;分词检索 中圈分类号:G354 文献标识码:C 文章编号:1002—1663(2006)05—0324一o4 InformationquerymethodandtacticforTPI heterostructureuniform indexsystem XIE Zhongwu (HeilongjiangElectricPowerResearchInstitute,Harbin150030,China) Abstract:Thebasicmechanismofheterostmcturequery,configurationofheterostmcturedatabaseandtacticof classifyingvocabularyusedforawholearticleindexontheplatformofHeilongiiangelectricpowersciencenad technologydi#talinformationwasintroduced.Thebasicmehtodnadhtetacticofheterostmctureunitedindex werediscussed,menawhile,cautionsworthnoticingduringindexwerealsopreesnted. Keywords:heterostmcturenidex;uqery tactic;indexmehtod;indexinclassification TPI是清华同方光盘股份有限公司自主研制 把检索结果传送给用户。 的一套基于Intemet、用于知识信息创建、生产、管 1.2 中文分词技术 理、维护和发布的工具软件系统。黑龙江省电力 TPI系统支持全文检索和数据项检索,全文 科技信息中心于2004年lO月引进了“TPI系统” 检索基于分词策略,查准率和查全率高。分词就 和 “万方电力数据资源系统”,并与信息中心自建 是将连续的字序列按照一定的规范重新组合成词 的数据资源进行了整合,建成了黑龙江省电力科 序列的过程。在英文的行文中,单词之间是以空 技数字化信息平台(以下简称平台)。平台运行 格作为自然分界符的,而中文只是字、句和段可以 近一年来,为科技人员的知识扩充、现场的技术改 通过明显的分界符来简单划界,唯独词没有一个 造以及科技管理水平的提升提供了大量的信息。 形式上的分界符,虽然英文也同样存在短语的划 分问题,但是在词这一层上,中文比之英文要复杂 1 认识USP和中文分词技术 的多、困难的多。通过引入分词技术,就可以使机 1.1 USP的工作原理 器对海量信息的整理更准确、更合理。 USP采用的是双层浏览器/服务器结构(B/ 应引起注意的是,“.”“/”“一”和空格等都 s)体系。用户向USP发出检索请求,USP根据配 是分词时使用的分隔符,所以在进行异构检索时, 置信息,把检索请求转换成对应于不同有哪些信誉好的足球投注网站引擎 在输入的检索词中不能包含这些字符,尤其在检 的实际检索请求,并向多个有哪些信誉好的足球投注网站引擎发出实际检 索技术标准或法规时,检索项 “标准编号”和

您可能关注的文档

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档