字符串模式匹配中DFA的应用.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
字符串模式匹配中DFA的应用

字符串模式匹配中DFA的应用 北京大学信息学院郭炜 GWPL@PKU.EDU.CN 本讲义部分内容引用北大信息科学技术学院贺一骏讲义 POJ1204 Word Puzzles 题目大意: 给出一个N*L的字符矩阵,再给出M个字符串, 问这M个字符串在这个字符矩阵中出现的位置。 MARGARITA ALEMA BARBECUE 数据范围: N,L=1000 M=1000 时间限制:5s 将问题抽象 将N*L的字符矩阵中的每行、每列、每斜 行,单独抽出得到了N+L+2*(N+L-1)个字符串, 加上它们的各自的逆序,则得到的字符串的数 目是: 2*(N+L+2*(N+L-1))=6N+6L-2 然后,现在的问题是判断之后给出的M个 字符串出现在以上的那些字符串的什么位置。 这里我们称前面抽象出来的6N+6L-2个串为原 串,之后给出的M个串为模式串。 思考… 强行匹配?时间复杂度:O(NLMlen) (len是模式串的平均长度) O(1012) 太不靠谱了!! KMP?时间复杂度:O(NLM) 9 O(10 ) 还是不能忍!! 确定性有限状态自动机 DFA(deterministic finite automata) DFA使用一个五元组(Q,q0,A ,∑,δ)来描述,这里Q为状 态集;q0为起始状态;A为终态集; ∑为字母表,δ为转移函数。 用一个图来描述一个自动机: 这是一个字符集为01的 DFA S=“001110” 可以匹配它 图中圆圈代表状态,箭头代表转移,例如从状态 “1”有一 条字符0的边指向状态 “10”,就是说在状态“1”如果碰到输 入是’0’那么就转移到状态“10”。状态empty之前有一个start 标记,我们称empty状态为初态;状态“10”多加了一个圆圈, 我们称他为终态。自动机的初态只有一个而终态可以由若干个。 确定性有限状态自动机 DFA是一个图结构的数据结构,每一个节点都有字符集 字符数条有向边,并且之所以称之为确定性的,是由于 任何一个节点,都不会存在标有相同字符的有向边指向 不同的节点。为了更好的理解,我们再给出一个复杂一 点的例子,终态为’nano’的自动机如下图所示,能够判 断输入串里是否包含“nano” 为了解决多串匹配问题,我们下面将介绍一种DFA,他是树 结构的模型(一般图模型的DFA在应用中并不是很多)。 单词前缀树(trie) 这个树有一个性质,那就是m个模式串中的前缀所组成的集 合A与根节点到每一个树中的节点的路径上的字符组成的字 符串S所组成的集合B,是一个满射的关系,即树中任一节点, 都对应于某个模式串的前缀。 单词前缀树(trie) 将串s插入到trie 的代码描述如下: struct trienode { void build(string s) trienode * child[26] ; { //假设所有字符就是26个字母 trienode* p=root; tr

文档评论(0)

hhuiws1482 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档