- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
DNA 序列分类模型模糊聚类
安徽农业大学学报,2005 ,32 (3 ):393 ~ 396 Journal of Anhui Agricultural University DNA 序列分类模型① 刘 丽 (合肥工业大学理学院,合肥230009 ) 摘 要:通过研究DNA 序列链之间的关联程度,构造出模糊矩阵。再利用模糊聚类方法进行聚类。运行该 模型时,只要输入几个待定参数及阈值 就可以将含有很多DNA 序列链的集合进行分类。 λ 关键词: DNA 序列;截矩阵;模糊聚类 λ 中图分类号:O29 文献标识码:A 文章编号:1672-352X(2005 )03-0393-04 2000 年6 月人类基因组计划中DNA 全序列草图完成,200 1 年2 月绘制了精确的全序列图,标志着生 命科学“登月计划”又向前迈出一步,从此人类拥有了一部记录着自身生老病死及遗传进化全部信息的 [1,2 ] “天书” 。DNA 作为一种遗传物质,早已在50 多年前就被发现。它是由4 种碱基:腺嘌呤(A )、胞嘧呤 (C )、鸟嘌呤(G )及胸腺嘧呤(T )按一定顺序排成的长约30 亿的序列,这其中既没有断句,也没有标点符 号。人们对DNA 的研究表明,A 和T 、G 和C 是2 对互补碱基,相互配对,构成了DNA 的双螺旋体结构,另 外人们通过对这种双螺旋体的直径测定证明了A 和T 、G 和C 之间分别通过2 个氢键和3 个氢键配对相 连。但是人们对DNA 序列的结构以及其中隐藏着什么规律却知之甚少,作为研究DNA 序列结构的尝试, 提出以下DNA 序列的分类问题:(1 )现有20 个已知类别的人造DNA 序列,其中第1 ~ 10 序列为A 类,第 11 ~ 20 序列为B 类,现要求从中提取特征,构造分类方法,并用构造的方法对另外第21 ~ 40 个未标明类 别的人工序列进行分类,并写出结果。(2 )用构造的分类方法来给部分天然DNA 序列进行分类,给出分 类结果。 1 模型假设[3 ~ 5 ] (1 )假设给出的人造DNA 序列片断均能充分反映该DNA 序列的全部特征; (2 )所研究的这些DNA 序列都是稳定的,至于在极少数情况下发生的DNA 变异不予考虑; (3 )无论从DNA 序列链的左边还是从右边为起点进行比较,对研究结果影响较小,可忽略不计,这里 假定从DNA 序列链的左边为起点进行比较。 表 1 DNAi 和DNAj 对应元素的待定关联系数 Table 1 The undetermined relation coefficients between those correspondence elements of DNAi and DNAj 碱基Base A G T C A 1 k1 k3 0 G k1 1 0 k4 T k3 0 1 k2 C 0 k4 k2 1 0 k1 、k2 、k3 、k4 1 (4 )若2 个DNA 序列进行比较时对应元素完全相同,则认为它们之间的相关程度最大,其关联系数 为1。嘌呤和嘌呤之间关联系数为k1 ,嘧啶和嘧啶之间的关联系数为k2 ,通过2 个氢键结合的碱基A 和T 间的关联系数为k3 ,通过3 个氢键结合的碱基C 和G
文档评论(0)