2025年大学《生物统计学》专业题库—— 基因表达谱数据处理与生物统计学方法.docxVIP

2025年大学《生物统计学》专业题库—— 基因表达谱数据处理与生物统计学方法.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年大学《生物统计学》专业题库——基因表达谱数据处理与生物统计学方法

考试时间:______分钟总分:______分姓名:______

一、填空题(每空2分,共20分)

1.基因表达谱数据标准化旨在消除不同实验间由于______、______等因素引起的系统性差异,使数据具有可比性。

2.在比较两组基因表达水平的假设检验中,若选择p值小于0.05作为拒绝原假设的阈值,意味着在______的情况下,观察到当前结果或更极端结果的概率小于5%。

3.火山图通常用于展示差异表达基因,横坐标代表______,纵坐标代表______,图中点的大小可以表示基因的倍数变化或方差。

4.t检验的基本假设包括______(方差齐性)和______(数据服从正态分布)。

5.在进行多因素方差分析(ANOVA)时,若主效应显著,通常需要进一步进行______以确定各因素水平之间是否存在特定的交互作用。

6.PCA(主成分分析)主要用于降维,它通过线性变换将原始变量投影到新的正交坐标轴(主成分)上,使得第一主成分解释的方差______,第二主成分解释的方差______。

7.对缺失值进行处理时,常见的策略包括______、______和模型基于方法。

8.在分类问题中,例如使用线性判别分析(LDA)对基因表达谱进行样本分类,其目标是找到一个投影方向,使得投影后不同类别的样本在投影方向上的______最大化,而类内离散度______。

9.评估一个差异表达分析结果的可靠性,除了看p值或FDR外,还需要关注______的大小,以及结果的生物学合理性。

10.使用R语言进行基因表达谱分析时,常用的包包括______和______。

二、名词解释(每题3分,共15分)

1.归一化(Normalization)

2.假发现率(FDR)

3.主成分分析(PCA)

4.基因芯片(Microarray)

5.交互作用(Interaction)

三、简答题(每题5分,共20分)

1.简述t检验和ANOVA在应用场景上的主要区别。

2.为什么在处理基因表达谱数据时需要进行标准化?请列举至少两种常见的标准化方法及其原理简述。

3.简述层次聚类和k-means聚类在算法原理上的主要不同点。

4.解释什么是多重比较问题,并简述一种常用的多重比较校正方法及其原理。

四、计算题(共25分)

1.(10分)假设有两种处理(T1和T2)对某一基因的表达水平有影响,你对每个处理测量了3个生物学重复样本的基因表达量(单位:FPKM),数据如下:

T1:10.5,11.2,10.8

T2:15.3,14.7,15.1

请计算T1和T2组该基因表达量的均值、标准差,并使用独立样本t检验(假设方差齐性)分析两组间是否存在显著差异(请写出检验统计量的计算过程和结论,无需报告p值,但需说明如何根据计算结果判断差异显著性)。

2.(15分)某研究比较了三种药物(A,B,C)对某一疾病模型的影响,测量了6个基因的表达量。假设已经完成了ANOVA分析,得到F统计量为5.2,对应的p值(FDR调整后)为0.05。请回答:

(a)这个p值(FDR调整后)的含义是什么?

(b)如果进一步进行了多重比较校正(例如使用Bonferroni方法),假设显著性阈值设为0.05/6,那么原ANOVA分析中哪些结果会被认为是统计显著的?

(c)假设ANOVA结果显示药物A与药物B之间存在显著的交互作用,请简述在后续分析中可能需要采取哪些步骤来进一步探究这种交互作用的具体情况。

五、论述题(15分)

结合你所学的生物统计学知识,论述在进行基因表达谱差异表达分析时,从数据预处理到结果解释需要考虑的关键环节,并说明每个环节中可能存在的问题或挑战。

试卷答案

一、填空题

1.样本提取技术实验操作流程

2.真实零假设

3.倍数变化(FoldChange)/效应量(EffectSize)p值

4.方差齐性数据服从正态分布

5.方差分析(ANOVA)后检验

6.最大最小

7.删除案例法回代法

8.距离/分离度最小化

9.倍数变化(FoldChange)/效应量(EffectSize)

10.limmaaffy

二、名词解释

1.归一化(Normalization):指通过特定的计算方法调整不同样本或不同实验间的数据差异,以消除由技术因素(如荧光淬灭效率、杂交探针特异性差异等)引起的系统性偏差,使不同样本的数据具有可比性,其主要目标是消除技术噪音,而非生物学噪音。

2.假发现率(FDR):在

您可能关注的文档

文档评论(0)

157****8295 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档