- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于一个中心度图的带有通配符和间隙长度约束的-武优西的个人主页
基于一个中心度图的带有通配符和间隙长度约束的模式匹配 导师:武优西教授 学生:沈丛 基于一个中心度图的带有通配符和间隙长度约束的模式匹配 作者 -Dan Guo, Xuegang Hu, Fei Xie, Xindong Wu 论文名 - Pattern matching with wildcards and gap-length constraints based on a centrality-degree graph 发表期刊或会议及页码 - Applied Intelligence 出版年份2012 页码1-18 - 该文被EI索引收录 目录 本文核心内容 本文主要提出的是一个图结构WON网。这个图代表着一个网络,该网络带有基于每个结点的中心度的权重度量。使用该网络去获取所有候选匹配解;同时本文设计WOW算法,WOW代表基于WON网的带有通配符的模式匹配。 背景和事例 模式匹配的在生物信息学上的例子: TATA在DNA序列中经常于CAATCT之后30-50个通配符出现。 一个PROSITE模式是一带有固定长度间隙为[4,9]的字符组成的序列。 在信息获取中,带有无用或者“不经心“的字符间隙的词汇更有意义。 背景和事例 例1 已知S = gagggcc和P = g ε0(1,2) ×g ε1(1,2)c,其中ε0(1,2)是一个长度可变的间隙,其通配符个数在1到2之间,通配符φ可匹配文本中的任意字符。 该表表示了模式的出现。 背景和事例 在S中所有的出现为{0,2,5,0,3,5,0,3,6,2,4,6}。 一次性条件下,我们的目标是取得解{0,3,5,2,4,6},而非{0,2,5}或者{0,3,6}。 背景和事例 现存的工作中,没有多项式算法能实现一个关于以上PMGO问题的完整解。虽然一系列的算法有提出,但在最优解问题上更胜一筹的算法还未出现。现有的算法均为启发式算法,未考虑在一次性条件下在整个候选解空间中不同出现之间的冲突。 本文所做的工作: (1)我们提出了一个图结构WON-Net,来表示在已知序列S中模式P的所有出现。其拥有三个优点:(a)它能够处理一个模式,每个子模式可由一些字符组成。(b)在在WON-Net的子结构上的并行执行能在不丢失解的同时改善效率。(c)可通过结点的中心度在所有出现中取得每个子模式的频繁度。 背景和事例 (2)基于WON-Net,提出了WOW算法来解决PMGO问题。比起其他同类算法,WOW的理念是,出现的权重中心度越小,与其他出现交叠的可能更小,来据此取得最优解。WOW比同类算法更为有效和稳定。 (3)我们还提出一个调整机制来平衡解与运算时间之间的关系。我们定义了一个新的WOW变量,WOW-δ。理论分析和实验表明,WOW和WOW-δ比同类算法更有效。运行时间也更有优势。 相关工作 一个通配符可以匹配在一个已知字母表中的任何字符。带通配符的模式匹配问题首先在文献16中有提出。之后,Cole等人提出了在模式中带有固定长度的通配符。U.Manber等人描述了带有间隙约束为[0,g]的通配符,其中g为一个可变的长度。在文献17中,提出有另一个间隙约束,其中的通配符有着同样的间隙约束[a,b](a≤b),诸如Aε(1, 3)Cε(1, 3)Gε(1, 3)C. 【16】Fischer MJ, Paterson MS (1974) String matching and other products.Technical report, Massachusetts Institute of Technology,Cambridge, MA, USA 【17】Zhang M, Kao B, Cheung DW, Yip KY (2005) Mining periodic patterns with gap requirement from sequences. In: Proceedings of ACM SIGMOD, Baltimore, Maryland, USA, pp 623–633 相关工作 通过打破该限制,Navarro和Raffinot提出了一个更为灵活的定义,用户被允许分别用不同长度的约束来指定通配符,例如模式P=Aε(0, 2)Cε(1, 3)G。为了移除大量无用的信息,在问题中兼有非重叠条件和一次性条件。Ding等人提出非交叠的条件,其不允许相同字符在已知序列中的同一个位置出现超过一次。一次性条件更为严格。 本文中,我们关注于定义在文献【8】中带有可变通配符的问题和文献【15】中一次性条件问题。 【8】Navarro G, Raffinot M (2002) Flexible pattern matching in strings—practical on-line sear
您可能关注的文档
- 园林给排水施工中的问题及解决对策.PDF
- 园艺实验中心教学大纲-东北农业大学植物科学与技术试验教学中心.DOC
- 园艺与景观治疗理论及操作技术 - tp.edu.tw.PPT
- 固体化学试题B卷.DOC
- 固体废物与化工废渣处理-江西铜业高级技工学校.ppt
- 固体氧化物燃料电池阳极的相转化流延制备和电化学-无机材料学报.PDF
- 园艺植物病害基础知识.ppt
- 固体氧化物电解质DCFC.PPT
- 固态复合混凝剂废水处理应用.pdf
- 固溶态CuNiSi合金时效过程的相变动力学-中国有色金属学报.PDF
- 基于单晶TiO2 纳米颗粒光阳极的高效染料敏化太阳能电池.PDF
- 基于变频控制的医用悬浮床改造设计 - 中国医疗设备.PDF
- 基于压电偏转镜的激光扫描系统设计-电子设计工程.pdf
- 基于外延剥离技术的薄膜LEDs 的电流扩展和热效应研究.PDF
- 基于十字单元的可调谐互补屏频率选择表面 - 计算机工程与科学.PDF
- 基于图割的图像分割方法及其新进展-OALib.PDF
- 基于夏玉米冠层内辐射分布的不同层叶面积指数模拟 - 农业工程学报.PDF
- 基于层次分析法的梅河口市地质灾害易发性区划Division-山东农业大学.PDF
- 基于底物类型的微生物燃料电池的产电特性 - 食品与生物技术学报.PDF
- 基于导电塑料传感器的连续测角系统设计 - 探矿工程在线.PDF
最近下载
- The Summer I Turned Pretty《我变美的那夏天(2022)》第二季第八集完整中英文对照剧本.docx VIP
- The Summer I Turned Pretty《我变美的那夏天(2022)》第二季第七集完整中英文对照剧本.docx VIP
- The Summer I Turned Pretty《我变美的那夏天(2022)》第二季第六集完整中英文对照剧本.docx VIP
- Unit 4 School days(Grammar) 课件 -2024-2025学年《英语》 七年级上册(译林版).pptx VIP
- 2024年四川省高考数学试卷(含答案解析)文科+理科.docx
- 中国助洗剂项目商业计划书.docx
- The Summer I Turned Pretty《我变美的那夏天(2022)》第二季第四集完整中英文对照剧本.docx VIP
- 中国硫酸黏菌素类产品项目商业计划书.docx
- 中国化学纤维制造项目创业计划书.docx
- 2025年中国四氯化锆项目投资计划书.docx
文档评论(0)