- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文信息学报中文文本分类中基于概念屏蔽层的特征提取方法3
中 文 信 息 学 报 第 20卷 第 3期 JO URNAL O F CH INESE INFO RM A T IO N PROCESS ING Vol. 20 No. 3 文章编号 : 1003 - 0077 (2006) 03 - 0022 - 07 中文文本分类中基于概念屏蔽层的特征提取方法 廖莎莎 ,江铭虎 (清华大学 人文学院计算语言实验室 , 清华大学 认知科学创新基地 ,北京 100084) 摘要 :本文提出了一种新的基于概念抽取和屏蔽层的特征选择方法 。该方法利用 HowN et概念词典中的 概念树 ,通过义原在概念树中的位置信息进行概念抽取 ,并赋予其适当权值来说明其描述能力 。对于权值低 于屏蔽层的义原 ,我们不将其选入特征集 ,并相应保留原词 。具体到每个词 ,我们计算其 D EF条 目中的权值 , 决定是将原词选入特征集还是进行概念抽取 。本文重点研究了如何给义原设定一个合适的权值 ,如何在选取 原词和概念之间取得平衡以及针对非概念词的加权处理 。实验证明 ,设定合适的屏蔽层 ,不仅可以缩小特征 维数 ,使分类正确率得到一定的提高 ,而且可以减少不同类别间的分类正确率的差别 。 关键词 :计算机应用 ; 中文信息处理 ;文本分类 ;特征提取 ;概念抽取 ;属性特征树 ;屏蔽层 ;描述能力 中图分类号 : TP39 1 文献标识码 : A A Fea ture Selection M ethod in C h in ese Tex t C la ssif ica tion Ba sed on Con cep t Ex traction w ith a Sh ielded L evel L IAO Shasha, J IAN G M inghu (L ab of Compu tational L ingu istic s of Ch inese L anguage, Cogn itive Sciences Innovation B ase Tsinghua U n iv. , B eij ing 100084 , Ch ina) A b stract: In th is p ap er, we p ropo se a novel featu re selection m ethod ba sed on concep t extraction and sh ielded level. In th ism ethod, we u se HowN et a s the sem antic dictionary to extract concep t attribu te s. B a sed on their po sition s in the concep t tree, the attribute s w ill get p rop er weights, wh ich p resen t their descrip tion powers. A concep t attribu te w ill not be selected a s feature if itsweigh t is lower than the shielded level and the original word w ill be reserved for u se. To each word, we calcu late all the weights of the concep t attributes in its D EF, and decide whether to extract the c
您可能关注的文档
最近下载
- 推拿学试题库(附参考答案).docx VIP
- 探讨平台经济下灵活就业人员的劳动权益保护问题.docx VIP
- 重症患者的营养支持PPT.ppt VIP
- 南瑞集团-水轮发电机组状态监测整体解决方案.pdf VIP
- 第二单元第1课《山水相逢》课件2025-2026学年人美版(2024)八年级美术上册 (1).pptx VIP
- 标准图集-华北-08BJ6-1地下工程防水1.pdf VIP
- 第2课 中国人首次进入自己的空间站(1课时)-课件(共23张PPT).pptx VIP
- 物业项目经理面试的53个经典问题(附参考答案).doc VIP
- 《观赏植物介绍》课件.ppt VIP
- 水电站碾压混凝土施工工法--rcc工法.doc VIP
文档评论(0)