生物信息课件6.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 基因芯片数据分析 二、寡核苷酸芯片  寡核苷酸芯片类似于cDNA芯片,但是在探针的设计上优于cDNA芯片,它的探针并不是来源于cDNA克隆,而是预先设计并合成的代表每个基因特异片段的约50mer左右长度的序列,然后将其点样到特定的基质上制备成芯片,从而克服了探针序列太长导致的非特异性交叉杂交和由于探针杂交条件变化巨大导致的数据结果的不可靠。 五、基因表达仓库 Gene Expression Omnibus,GEO 六、斯坦福微阵列数据库 The Stanford Microarray  Database,SMD 第二节 基因芯片数据预处理 (General Microarray Data Type and Database ) 数据过滤 数据过滤的目的是去除表达水平是负值或很小的数据、或者明显的噪声数据。 过闪耀现象 物理因素导致的信号污染 杂交效能低 点样问题 其它 二、数据补缺 (一)数据缺失类型 非随机缺失 基因表达丰度过高或过低 随机缺失 与基因表达丰度无关,数据 补缺主要针对随机缺失情况 (二)数据补缺方法 1、简单补缺法 2、K近邻法 3、回归法 三、数据标准化 (一)为什么要进行数据标准化 存在不同来源的系统误差 染料物理特性差异(热和光敏感性,半衰期等) 染料连接效能 点样针差异 数据收集过程中扫描设施 不同芯片差异 实验条件差异 (二)运用哪些基因进行标准化处理 芯片上大部分基因(假设芯片上大部分基因在不同条件下表达量相同) 不同条件间稳定表达的基因(如持家基因) 控制序列(spiked control ) 合成DNA序列或外源的DNA序列,在不同条件下表达水平相同。 (三) cDNA芯片数据标准化处理 1、片内标化(Within-slide normalization) (1) 全局标化(Global normalization) (2) 荧光强度依赖的标化(Intensity dependent normalization) (3) 点样针依赖的标化(Within-print-tip-group normalization) (4) 尺度调整(Scale adjustment) 为什么 调整不同栅格(grids)间的数据离散度 方法:计算不同栅格的尺度因子 2、片间标化(Multiple-slide normalization) 线性标化法(Linear scaling methods) 与芯片内标化的尺度调整(Scale adjustment) 方法类似 非线性标化法(non-linear methods) 分位数标化法(Quantile normalization) 两张芯片的表达数据的分位数标化至相同,即分布于对角线上。 3、染色互换实验(dye-swap experiment ) 的标化 实验组 对照组 芯片1 cy5(R) cy3(G’) 芯片2 cy3(G) cy5(R’) 前提假设:c︽c’ 方法: (四) Affymetrix芯片数据标准化 1、 提取定性信号 (1)对每个探针对计算R R = (PM - MM) / (PM + MM) (2)比较R与定义的阈值Tau(小的正值,默认值为0.015 ). (3) 单侧的Wilcoxon’s Signed Rank test产生p值,根据p值定义定量信号值 Present call Marginal call Absent call 2、提取定量信号 (1)分析步骤 获取探针水平数据 背景值效正 标准化处理 探针特异背景值效正 探针集信号的汇总 前面提及的标准化方法仅效正了数据分布的中心,在不同的栅格间log-Ratios 的方差也不同。 第三节 差异表达分析 (Analysis of Differentially Expression Gene ) 一、倍数法 二、统计学方法 1、t检验法 2、方差分析 三、SAM (Significance Analysis of Microarrays) (一) 多重假设检验问题 Ⅰ型错误(假阳性)即在假设检验作推断结论时,拒绝了实际上正确的检验假设,即将无差异表达的基因判断为差异表达。 Ⅱ型错误(假阴性)即不拒绝实际上不正确的,即将有差异表达的基因判断为无差异表达。 在进行差异基因挑选时,整个差异

文档评论(0)

一天一点 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档