- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
NS过程进行全文检索,并将结果( pr
第二军医大学硕士研究生论文 事先要创建一张临时的表,用于存放查询的结果;查询的第一步是调用 Context的CTXQUERYCONTAINS过程进行全文检索,并将结果(primarykey 值,出现频率等)存入临时表中,第二步,用SQL的select命令从结果表中获取 文本内容,文本中的关键词两端均加了标记符号。 单步查询 通过在SQL语句中直接调用Context的Contains函数来查询,这种方式无需 建立和存取临时表,效率较高。 下面的例子说明在表text的Content字段中,查询 “中文’,或 “全文检索’, 字符串的单步查询的SQL语法,按出现该关键词的频率由大到小排序: selectscore(1),titlerfomtextwherecontains (content,’中文}全文检索’,1)0order勿score(1): 在上述的单步查询中,“中文}全文检索’,参数为查询表达式,Context支持 多种查询操作符来完成各种组合条件、模糊条件查询,常用的一些操作符如下: 1)通配符 “%”通配任意多个字节的字符;通配符_(下划线)通配任意一个 字节的字符。利用通配符可以实现一种 “包含”的匹配查询; 2)操作符 “”表示同时包含几个字符串的操作符,可用 “”来完成 “既 包含A、又包含13-,的查询要求; 3)操作符 “1”表示或者的操作符,可用 “}”来完成 “或者包含A、或者包 含B”的查询要求; 4)大括号 “{}’,的作用是将逻辑表达式括起来,以实现条件的分组,类似于 数学表达式中小括号的作用。 5.3运行过程与结果分析 5.3.1数据准备 由于实施本系统的目的,一是建立一个实用的病案全文检索系统,一是在中 文分词的算法上进行研究,所以有必要准备两套数据源的,一套是病案原文DOC 文档,一套是经过分词后的DOC文档。因为ORACLE本身会对DOC文档进行 分词,这样操作的目的是为了对我们提出的知识分词算法进行对照。 5.3.2加载数据 第二军医大学硕士研究生论文 ORACLE推荐将文档装载到文档字段中。即使是这样,仍然可以将文档内 容以其它形式存放,比如文件系统、URL等。我们在本系统中将文档加载到文 档字段中。下面介绍最常用的两种由文件系统进行加载的方法。用于存放文本信 息的表结构为: createtabledoeinfo (idnumberprimarykey, //文档ID titlevarchar2(200), //文档名称 textblob, //文档全文 formatcolvarchar2(10),//文档格式 charsetcolvarchar2(20),//文档所用字符集 langvarchar2(8), //文档语言 ); 使用SQL*Loader:装载文档 SQL*Loader:是数据库提供的公用程序,用于装载外部数据。使用SQL *Loader需要一个一个控制文件(设为load.ctl)和装载信息文件(设为load.data). 其中,load.ctl说明了load.data文件内容的格式,load.data中包含了需要加 载的文件的信息。可以使用逗号作为定界符。 SQL*Loader虽然可以用于批量的装载文档,但是不能将文档文件载入己存 在的行内。此时就可以使用DBMS.LOB,这首先需要在数据库中创建一个目录 (这要求用户有CREATEANYDIRECTORY的权限),建立一个你要加载的文件 所在目录的别名。然后调用DBMS.LOADFRROMFILE()函数。需要注意的是在 进行中文检索时,加载文件之后,还需要将所加载的文件的信息,如:格式、字 符集、语言等信息添加到相应的列中。 5.3.3检索结果 为了对比较系统知识分词算法与ORACLE自带分词系统进行比较,必须进 行检索测试。 首先要确定测试数据集。在两类系统中,我们用不同的两个检索式 “乙肝 的治疗”、“感冒的常见症状”各自检索出100篇文章。共计400篇文章,然后请 来相关科室专家对这些文章进行挑选,选出供200篇文章作为测试
有哪些信誉好的足球投注网站
文档评论(0)