chap5-dna序列分析.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
chap5-dna序列分析

生物信息学数据挖掘 纲 要 第一节 核酸序列分析基础 第二节 核酸序列的遗传性质分析 第三节 核酸序列的物理性质分析 第一节 核酸序列分析基础 基因的结构 基因的表达与调控 功能位点(functional site) 2. 基因的表达与调控 3. 功能位点(functional site) 定义: 与特定功能相关的位点。 生物分子序列上的一个功能单元,或短片段。 核酸序列的功能位点 转录因子结合位点 转录剪切位点 翻译起始位点等 蛋白质序列的功能位点常称为序列模体(Motif) 序列模式 蛋白质结构域 作用部位 第二节 核酸序列的遗传分析 分析步骤 注意事项 污染的剔除 识别和遮蔽重复序列 开放阅读框的识别 CpG岛的识别 基因功能区的预测 DNA序列分析存在的问题 识别序列中的非编码区 序列中载体污染的剔除 重复元件的发现 CpG岛 启动子位点 Poly-A位点 核基质缔合区(Matrix association region,MAR) 转录因子结合位点 识别与鉴定序列中的基因 序列的编码区(外显子) 构建基因的外显子模型 数据库相似性有哪些信誉好的足球投注网站 与模式生物基因组的同源区比对 2. 注意事项 对真核生物序列,首先遮蔽重复序列 程序的特定生物物种适用性 程序的序列特定性(DNA或cDNA) 序列的长度 多方面的证据与验证 3. 污染的剔除 序列污染的来源 载体序列 接头和引物序列 转座子和插入序列 DNA和RNA样品污染 序列污染的后果 导致无意义的分析 对序列的生物显著性作出错误的判断 导致错误的叠连群拼接和ESTs分群 导致数据库的污染 序列污染的发现 对载体数据库进行相似性有哪些信誉好的足球投注网站 有哪些信誉好的足球投注网站序列中的限制性内切酶位点 对其它数据库进行有哪些信誉好的足球投注网站,如宿主序列数据库等 序列污染的剔除 NCBI的VecScreen EMBL的Blast2 EVEC 识别出其边界,去除 4. 识别和遮蔽重复序列 重复序列存在的广泛性 人类基因组约30%,蟾蜍达70% 重复序列对序列分析的影响 序列分析严重失误 错误的功能注释 重复序列的特点 多为RNA聚合酶Ⅱ转录的部分区域 几乎不会覆盖启动子或外显子编码区 按照序列重复情况分类 非重复序列 轻度重复序列 中度重复序列 高度重复序列 重复元件 SINE、ALU、MIR、LINE LTR、MALR、ERVL 散在重复元件、小RNA、 卫星DNA、简单重复序列 低复杂度序列 重复序列分析常用的程序 RepeatMasker(/) 主要针对灵长类和啮齿类动物、拟南芥、草本植物、果蝇等,也适用于其它哺乳和脊椎动物 Censor(/censor/) 适用于任何物种 重复序列分析应注意的问题 重复序列数据库的完整性 不同方法分析比较 Censor分析结果 一个ORF就是一个潜在的蛋白质编码区 原核基因,一个编码区就是一个单独的ORF 真核基因的编码区域是非连续的 非编码区(内含子) 不连续的编码片段(外显子), 必须正确识别出内含子和外显子的边界, 如果使用的是cDNA,问题就简化了 一个DNA序列可能有多个ORF,其中只有少数是真正的编码区 一段连续较长的ORF可能是编码序列 一些短的ORF也可能编码具有生物功能短肽 分析一个ORF是否编码,要结合序列本身和其它分析方法,才能做出正确的结论。 ORF (Open Reading Frame) Finder 6. CpG岛的识别 CpG岛也称为HTF岛,是一些富含GC的小区域。通常管家基因或频繁表达基因的启动子周围(通常在5’UTR)都含有非甲基化的CpG岛。 80%的人类基因转录起始位点前存在CpG岛,而在基因组其他地方缺乏这种序列。 查找序列中CpG岛的软件 CpGplot(http://www.ebi.ac.uk/emboss/cpgplot/) CpG islands revealing (r.it/cgi-bin/wwwcpg.pl) CpG岛分析结果 7. 基因功能区的预测 信号有哪些信誉好的足球投注网站(检索与功能区有关的信号) 启动子元件 转录终止信号 外显子剪切位点 起始和终止密码子 5’端外显子在核心启动子的下游 3’端外显子的下游包含多聚A信号和终止信号 内容有哪些信誉好的足球投注网站(序列的统计分析) 检查终止密码子的出现频率 7.1 启动子与转录因子结合位点识别 启动子 转录因子结合位点 核心启动序列 上下游相关的调控元件 启动子识别的算法 计算已知启动子序列和非启动子序列各自含有的转录结合位点的密度,然后形成每种结合位点在启动子序列上的密度比,组合每个单独的密度比值形成打分矩阵 分析启动子区、非启动子区、编码区序列的核苷酸频率 启动子区预测工具 TRES Neural Network Promoter Prediction Drago

文档评论(0)

2017meng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档