HiddenMarkovModelanditsapplicationinPos.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HiddenMarkovModelanditsapplicationinPos.ppt

词性标注与隐马尔可夫模型 概要 词性标注 HMM模型 HMM模型用于词性标注 相关问题讨论 词性标注 定义及任务描述 词性标注的问题 - 标注歧义 (兼类词) 词性标注之重要性 词性标注方法 词性标注任务描述 什么叫词性? 词性又称词类,是指词的语法分类,或者说是按照其各自的语法功能的不同而分出来的类别 划分词类的依据 词的形态、词的语法意义、词的语法功能 汉语的词类划分 词性标注:给某种语言的词标注上其所属的词类 The lead paint is unsafe. The/Det lead/N paint/N is/V unsafe/Adj. 他有较强的领导才能。 他/代词 有/动词 较/副词 强/形容词 的/助词 领导/名词 才能/名词。 词性标注问题 - 词性标注歧义(兼类词) 一个词具有两个或者两个以上的词性 英文的Brown语料库中,10.4%的词是兼类词 The back door On my back Promise to back the bill 汉语兼类词 把门锁上, 买了一把锁 他研究与自然语言处理相关的研究工作 汉语词类确定的特殊难点 对兼类词消歧- 词性标注的任务 词性标注的应用及重要性 机器翻译 Text – Speech 词法句法规则 - 词性组合 句法分析的预处理 统计自然语言处理的基础 词性标注常见方法 规则方法: 词典提供候选词性 人工整理标注规则 统计方法 寻找概率最大的标注序列 如何建立统计模型 P( tag, word ) HMM方法(Garside et al. 1987,Church 1988) 决策树方法(Schmid 1994) 最大墒方法(Ratnaparkhi 1996) 基于错误驱动的方法 错误驱动学习规则 利用规则重新标注词性 词性标注的性能指标 性能指标:标注准确率 当前方法正确率可以达到97% 正确率基线(Baseline)可以达到90% 基线的做法: 给每个词标上它最常见的词性 所有的未登录词标上名词词性 决定一个词词性的因素 从语言学角度:由词的用法以及在句中的语法功能决定 统计学角度: 和上下文的词性(前后词的标注)相关 和上下文单词(前后词)相关 隐马尔可夫模型 - 概要 背景 马尔可夫模型 隐马尔可夫模型 模型评估 解码 模型参数学习 背景 俄国统计学家Andrei Markov(1856-1922)提出 Studied temporal probability models Real-world Observed output (signals) Signal Models – stimulate the signals source and learn as much as possible through simulations 马尔可夫模型 举例说明马尔可夫模型 马尔可夫假设 马尔可夫模型示例 - 天气预报 状态:雨、多云、晴 给定不同天气之间的转换概率,预测未来数天的天气 通过如右图所示的矩阵描述状态之间的转移概率 马尔可夫模型示例 - 天气预报 通过有限状态自动机描述状态转移概率 预测 - 计算未来天气 (序列的概率) 晴-晴-雨-雨-晴-多云-晴,未来七天天气是这种情况的概率 马尔可夫假设 假设1 有限视野 P(Ot+1=Sk|O1,…Ot) = P(Ot+1=Sk|Ot-(n-1),…Ot) (n-1)th 阶马尔可夫链 → n 元语言模型 假设2 时间独立性 P(Ot+1=Sk|Ot) = P(O2=Sk|O1) 隐马尔可夫模型 - Hidden Markov Model (HMM) 介绍 定义 隐马模型应用于词性标注 HMM模型的简单介绍 “隐”在何处? 状态(序列)是不可见的(隐藏的) HMM是一阶马尔可夫模型的扩展 观察值与状态之间存在概率关系 隐藏的状态序列满足一阶马尔可夫模型 相对于markov模型的又一假设:输出独立性 HMM的定义 定义:一个HMM模型 λ=(A,B,π) S是状态集, S=(S1,S2,…SN) V是观察集, V=(V1,V2,…VM) 状态序列Q = q1q2…qT (隐藏) ,观察序列O=o1o2…oT (可见) A是状态转移概率分布A=[aij], aij=P(qt=sj|qt-1=si) (满足假设1.) B是观察值生成概率分布B=[bj(vk)], bj(vk)=P(ot=vk|qt=si) (满足假设2、3) 初始观察值概率分布 Π= [πi], πi =P(q1=si) 词性标注的HMM模型定义 HMM:S V A B π S:预先定义的词性标注集 V:文本中的词汇

文档评论(0)

ailuojue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档