一种基于聚集系数的人名识别方法-武汉大学学报·信息科学版.PDF

下载文档

1
0
约2.21万字
约 6页
2019-05-02 发布于天津
举报
版权申诉
保障服务

一种基于聚集系数的人名识别方法-武汉大学学报·信息科学版.PDF

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第卷第期计算机工程年月人工智能及识别技术文章编号文献标志码中图分类号一种基于聚集系数的人名识别方法曾剑平刘华复旦大学计算机科学技术学院上海安徽省高级人民法院信息办合肥摘要在中文文本分析的许多应用领域中人名识别是一个广泛存在且受到持续关注的基本问题虽然目前人名识别方法较多但大多以语料统计和语言规则为基础为此针对事件文本中人名具有紧密联系的特征基于聚集系数提出一种新的人名识别方法利用姓氏列表获得原始文本中的可能姓氏信息基于人名语料信息所构建的统计模型和上下文新的信息提取出候选人名定义人际语义相似性人名可能度等量化方法在此基础上设计一种基于人际网络聚集系数的人名过滤方法实验结果表明与现有基于隐马尔可夫模型的方法相比该方法所获得的值有的提升并且不需要人工标注语料及使用语言规则关键词人名识别聚集系数人际网络统计模型人际语义相似性中文引用格式曾剑平刘华一种基于聚集系数的人名识别方法计算机工程英文引用格式容过滤的准确性现有的人名识别方法大体上基概述于种途径统计方法利用自然语言的统计在诸如新闻报道之类的文本中存在许多人名规律采用条件随机场隐等模型描述人名地名等命名识别这些信息在文本分析应用中起着的特征基于规则的方法利用人名在上下文中非常重要的作用例如在网络舆情分析中人名是的使用规则来提取人名信息这些方法需要充足的舆情事件识别分析中的核心是事件演化中的主导人工标注语料或者复杂的语言和使用规则而此类因素因此事件跟踪与检测方法一般需要明确地对