- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维普资讯 ●叶新 明 (南京大学 江苏) 5斗、lI 文文献 自动分类研究概述 提 要 概要性地论述 了中文文献 自砷分 类的问题 ,提 出了中文文献 自动分类 的一般模式 同时也分析 了毒 实现 中文文献 自功分类 目前所面临 的一些薯际 问题 。 美锎 §塑坌誊 皇 兰壹 分类过程来 自动地实现中文文献的分类标引 美国学 0 引言 者 P.伦每兹曾怍过试验:一是让6位标引者同标一篇 国外的文献 自动分类研究始 于 50年代束,到现 文献,设一致性为 1,所达刊的一致率只有 0.158, 在大致经历 了3十发展阶段 : 两 人标 『,其一致率 也 只有 0.543;二 是 同一 篇文 第一阶段 (1958--1964年)研究 自动分类的可能 献 , 由~人在不 同时 间完成标 引.其 一致率 也仅有 性 ; O661。而采用计算虮进行 自动标引则不会出现选种差 第二阶段 (1965—1974年)进人 自动分类的实验 异.可以不受时间、空间、人力等因素的影响,减少 性阶段 : 主观性,能较客观地反映文献的学科内容 ,保持文献 第三阶段 (1975一 )是 自动分类的实用性阶 分类标引的一致性 ,这是人工标引所无法达到的,一 段 。 且采用 自动分类能够保证有较好的查垒率和查准率。 在这发展过程 中,研 究 自动分类的主要人物 有: 中文文献 自动分类的一般模式见下图 K Spark,G.Salton, R.M .Ncedham,M .E.Lesk和 K SJones等 归结起来,主要从基干文本的词频统 计分析,句法分析和语义分析 3个层次上采研究 的, 但以基干词额统计分折的 自动分类较为成功。词额统 计 的原始思想最初是 由美 国著名 的情报检索专家 H PLuhn于 1957年提出的,尔后被应用于 自动分类 领域。 我国的 自动分类研究起步较晚,特别是有关中文 文献的 自动分类, 目前能见诸报刊的科研论文仅有几 篇, 比如 : 《中文文献 自动分类的理论与 实践》… 、 《中文文献 的 自动分类》∞ 《图书分类专 家系统设 计》 和 《中文文献的自动标引》 “等 1 中文文献 自动分类的一般模式 文献分类就是以分类法为工具 ,根据文献所反映 的学科知识内容与其他显著属性特征 ,分门导类地系 统地组织与揭示文献 。文献分类的最终 目的是为了让 图 1 中文文献 自动舟类模式 读者更好地充分地利用文献 .分类时应 以学科知识 内 以上 7个步骧我们简要说明如下: 容作为文献分类的主要依据,辅以其它显著属 性特 (1)输入文献的题名和摘要。这是实现 自动分类 征 的最基础的工怍. 由于有了文献的题名和摘要,即计 中文文献的 自动分类就是采用计算机模仿人工的 算机可识别的文献表示形式,才能对文献进行 自动的 一 · 情报理论与实践 · 39— 维普资讯 主题分析 。需要说明的 一点是用计算机进行 自动
文档评论(0)