关联分析..docx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关联分析.

应用STRUCTRE软件(Pritchard 2000),是对群体进行基于数学模型的类群划分,并计算材料相应的Q值(第i材料其基因组变异源于第k群体的概率)。分析的大致理念是,首先假定样本存在K个等位变异频率特征类型数(即服从Hardy-Weinberger平衡的亚群,这里K可以是未知的),每一类群标记位点由一套等位变异频率表征,将样本中各材料归到(或然率用Bayesian方法估计)第k个亚群,使得该亚群群体内位点频率都遵循同一个Hardy-Weinberg平衡。群体结构的问题探讨一网友问了以下问题:你好,我也想请问一下关联分析中遇到的几个疑问,1.所谓的群体结构的消除是指群体结构越简单越好吗?为什么有的植物研究中分了好多的群,如果分布不是很均匀就是存在群体结构?2.在群体结构分析过程中选择标记越多越好好,是每个染色体平均距离的选几个最合适?有没有明确的规定啊?希望能得到您的赐教,谢谢我的回复:(1)首先需要搞清楚群体结构的定义(见以下幻灯)。在现实群体中,很难有(a)类理想群体,因此在绝大多数情况下,我们在统计分析时都要将群体结构造成的伪关联考虑进去,而不是消除。常见的办法就是应用STRUCTRE软件,进行基于数学模型的类群划分,计算材料相应的Q值(第i材料其基因组变异源于第k群体的概率)。分析的大致原理是,首先假定样本存在K个等位变异频率特征类型数(即服从Hardy-Weinberger平衡的亚群,这里K可以是未知的),每一类群SSR位点由一套等位变异频率表征,将样本中各材料归到(或然率用Bayesian方法估计)第k个亚群,使得该亚群群内位点频率都遵循同一个Hardy-Weinberg平衡。所得Q值会作为协变量纳入后续的关联分析的回归方程。(2)群体结构分析过程中选择标记的多少,已有模拟研究的结果,详见文献:Simulation Appraisal of the Adequacy of Number of Background Markers for Relationship Estimation in Association Mapping;Jianming Yu,* et al;Published in The Plant Genome 2:63–77. Published 18 Mar. 2009.;doi: 10.3835/plantgenome2008.09.0009文章的建议是:For Q,1000 single nucleotide polymorphisms or 100 simple sequence repeats for maize. For K (a minimum of several hundred SNPs spread over the whole genome is recommended ...选取标记时注意:标记距离要远些,距离近的标记不适合Structure软件分析,正如软件说明所述“The model assumes that markers are not in linkage disequilibrium (LD) within subpopulations, so we cant handle markers that are extremely close together……..”2.关联分析的优点(1)不需要专门构建作图群体,自然群体或种质资源都可作为研究材料;(2)广泛的遗传材料可同时考察多个性状大多数QTL关联位点及其等位变异,不受传统的FBL的“两亲本范围”的限制;(3)自然群体经历了许多轮重组后,LD衰减,存在于很短的距离内,保证了定位的更高精确性连锁不平衡和遗传连锁的关系连锁不平衡并不等同于遗传连锁,它们之间既有联系又有区别:遗传连锁考虑的是两位点间的重组率是否等于0.5,一般来说,同一染色体上的任何两位点间都存在一定的连锁关系。? 连锁不平衡考虑的是不同位点上基因之间的相关性,只要一个基因座上的特定等位变异与另一基因座上的某等位变异同时出现的几率大于群体中随机组合几率时,就称这两个等位基因处于连锁不平衡状态;当然,当两位点间处于紧密连锁状态时,其等位基因间可能存在较强的连锁不平衡关系。尊敬的文老师,您好!我是山东农业大学的一名研究生,实验涉及小麦关联分析。拜读您的文章,得知您是这方面的专家。我在处理数据时遇到些问题,希望您百忙之中能给于解答,不胜感激!1 、在LD分析中,a 、我看到很多文献所进行分析的范围多是不一样的,有的是分析各个亚群的LD,有的分析不同染色体上的LD,也有的分析小麦染色体组的,请问他们分析的目的是什么,在什么情况下做何种分析比较好呢b 、很多文献中分析同线性(同一染色体上)的LD和非共线的LD,并将非共线的LD作为背景LD,请问

文档评论(0)

叮当文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档