- 1、本文档共86页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章 基因组序列诠释 问 题 基因组序列所包含的全部遗传信息是什么? 基因组作为一个整体如何行使其功能? 用什么方法寻找基因,研究基因地功能呢? 1. 寻找基因 1.1 根据开放读框预测基因 ⑴ 起始密码子 ATG 第一个ATG的确定(依据Kozak规则); Kozak规则是基于已知数据的统计结果. 所谓Kozak规则,即第一个ATG侧翼序列的碱基分布所满足的统计规律. Kozak规则: 若将第一个ATG中的碱基A,T,G分别标为1,2,3位,则Kozak规则可描述如下: (1)第4位的偏好碱基为G; (2)ATG的5’端约15bp范围的侧翼序列内不含碱基T; (3)在-3,-6和-9位置,G是偏好碱基; (4)除-3,-6和-9位,在整个侧翼序列区,C是偏好碱基。 信号肽分析软件 (SignalP http://www.cbs.dtu.dk/services/signalP ) 把预测过程中证实含完整mRNA 5’端的序列翻译为蛋白序列; 然后用SignalP软件对前50个氨基酸序列(从第一个ATG对应的甲硫氨酸Met开始)进行评估,如果SignalP分析给出正面结果,则测试序列有可能为信号肽; ⑶ 终止密码子 ⑷ 3’端的确认 ⑸ 非编码序列、内含子 编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同。 不同种属间使用同义密码的频率有很大差异: 如人类基因中, 丙氨酸(Ale)密码子多为GCA,GCC或GCT,而GCG很少 苏氨酸(Thr)密码子多为ACA,ACC或ACT,而ACG很少 ⑺ 密码子偏爱性 ⑻ 外显子-内含子边界 ⑼上游控制序列 CG岛有1Kb,CG含量高,56%的人类基因与上游的CG岛相连。主要用于原核生物。 ⑽ 内含子和外显子序列差异 ⑾ 软件预测 采用NCBI的ORF预测软件 ( ORF finder: /gorf/orfig.cgi )判断ORF的可能范围。 基因注释软件 Genscan ——重于信号指令:起始密码、终止密码、剪接受体位和供体位序列等 FgeneSH ——重于内容指令:密码子使用偏好、内含子外显子的差异等 TWINSCAN和SGP2——根据相似性和一致性 基因注释软件缺点 外显子注释的准确率 80%。 误拼和误拆错误较多。 容易忽略结构较小的基因,特别是基因内基因。 包括内容:转录成mRNA的序列,外显子和内含子的位置,基因编码的蛋白质顺序。 脊椎动物的130bp的外显子长度平均,68-208的占65%,10%的小于60bp,35%的人类基因组序列存在非编码外显子,注释容易遗漏,热别是保守性不强的外显子。 目前的软件均无法注释mRNA的53非编码区的边界。 1.2 同源查询途径 通过已存入数据库中的基因顺序与待查的基因组序列进行比较,从中查找可与之匹配的碱基顺序及其比例,用于界定基因的方法称为同源查询。 同源性包括编码和非编码序列,相近的物种,老鼠和人,油菜和拟南芥具有90%以上的基因彼此共有。编码序列,外显子组成,调控序列,相似之处 进化的保守性。 相似性有如下几种情况: A DNA序列某些片段完全相同; B 开放读码框(ORF)排列类似,如有长外显子; C 开放读码框翻译成氨基酸序列的相似性; D 模拟多肽高级结构相似 功能和结构相似的直向同源基因成员,起源相同,存在保守序列。还有就是同一物种的家族基因,基因重复造成的。 可综合考虑也可单项考虑,如果一个基因没有同源序列,又符合一些条件,试验方法证实。 同源性:homology起源于同一祖先但序列已经发生变异的序列,分布在不同物种间的同源基因,只有是与非的区别。 分子杂交可确定DNA片段是否含有表达顺序 Northern blot:指将待测DNA样品标记后与RNA杂交,以判断RNA中是否含有DNA的转录产物。但在操作中存在一些问题 Troponin T是心肌特异性蛋白,主要用于心肌梗塞等多种心脏病的研究 C 基因表达产物丰度的问题 如果某一物种的DNA 顺序与来自另一亲缘物种的DNA片段杂交产生阳性信号,该区段可能含有1个或多个基因,这种方法又称为动物园杂交。 DNA顺序中基因位置的确定 cDNA测序受两个方面的影响: 一是相关cDNA在cDNA文库中出现的频率; 二是cDNA的完整性 Northern blot和Zoo blot可以判断DNA片段中是否含有基因,但是不能给出基因定位信息。获得基因定位信息的最容易的方法是cDNA测序 如何获取基因全长cDN
文档评论(0)