- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
条件随机场
conditionalrandomfields
条件随机场模型是Lafferty于2001年,在最大熵模型和隐马尔科夫模型的基础上,提出的一种判别式概率无向图学习模型,是一种用于标注和切分有序数据的条件概率模型。01CRF最早是针对序列数据分析提出的,现已成功应用于自然语言处理(NaturalLanguageProcessing,NLP)、生物信息学、机器视觉及网络智能等领域。02条件随机场概述
序列标注标注:人名地名组织名观察序列:毛泽东标注:名词动词助词形容词副词……观察序列:今天天气非常好!实体命名识别汉语词性标注
四、隐马尔可夫模型(HiddenMarkovModel,HMM)一、产生式模型和判别式模型(Generativemodelvs.Discriminativemodel)二、概率图模型(GraphicalModels)五、最大熵模型(MaximumEntropyModel,MEM)七、条件随机场(conditionalrandomfields,CRF)三、朴素贝叶斯分类器(NaiveBayesClassi?er)六、最大熵马尔可夫模型(MEMM)
一、产生式模型和判别式模型(Generativemodelvs.Discriminativemodel)产生式模型:构建o和s的联合分布p(s,o),因可以根据联合概率来生成样本,如HMM,BNs,MRF。产生式模型:无穷样本==》概率密度模型=产生模型==》预测
判别式模型:有限样本==》判别函数=预测模型==》预测?判别式模型:构建o和s的条件分布p(s|o),因为没有s的知识,无法生成样本,只能判断分类,如SVM,CRF,MEMM。o和s分别代表观察序列和标记序列
一个举例:(1,0),(1,0),(2,0),(2,1)P(y|x):
P(0|1)=1,P(1|1)=0,P(0|2)=1/2,P(1|2)=1/2判别式模型:产生式模型:P(x,y):
P(1,0)=1/2,P(1,1)=0,P(2,0)=1/4,P(2,1)=1/4.
两种模型比较:Generativemodel:从统计的角度表示数据的分布情况,能够反映同类数据本身的相似度,不关心判别边界。12实际上带的信息要比判别模型丰富,?研究单类问题比判别模型灵活性强能更充分的利用先验知识模型可以通过增量学习得到优点:学习过程比较复杂在目标分类问题中易产生较大的错误率缺点:
Discriminativemodel:寻找不同类别之间的最优分类面,反映的是异类数据之间的差异。优点:分类边界更灵活,比使用纯概率方法或生产模型得到的更高级。能清晰的分辨出多类或某一类与其他类之间的差异特征在聚类、viewpointchanges,partialocclusionandscalevariations中的效果较好适用于较多类别的识别缺点:不能反映训练数据本身的特性。能力有限,可以告诉你的是1还是2,但没有办法把整个场景描述出来。二者关系:由生成模型可以得到判别模型,但由判别模型得不到生成模型。
二、概率图模型(GraphicalModels)顶点/节点,表示随机变量边/弧两个节点邻接:两个节点之间存在边,记为,不存在边,表示条件独立路径:若对每个i,都有,则称序列为一条路径概率图模型:是一类用图的形式表示随机变量之间条件依赖关系的概率模型,是概率论与图论的结合。图中的节点表示随机变量,缺少边表示条件独立假设。
根据图中边有无方向,常用的概率图模型分为两类:有向图:最基本的是贝叶斯网络(BayesianNetworks,BNs)举例
5%55%30%10%有向图模型的联合概率分解P(当前节点|它的父节点)每个节点的条件概率分布表示为:联合分布:
无向图:马尔可夫随机场(MarkovRandomFields,MRF)马尔可夫随机场模型中包含了一组具有马尔可夫性质的随机变量,这些变量之间的关系用无向图来表示马尔科夫性:举例
团(clique):任何一个全连通(任意两个顶点间都有边相连)的子图最大团(maximalclique):不能被其它团所包含的团X1X2X3X4例如右图的团有C1={X1,X2,X3}和C2={X2,X3,X4}无向图模型的联合概率分解势函数(potentialfunction)是关于上随机变量的函数
设x∈Ω是一个类别未知的数据样本,Y为类别集
文档评论(0)