- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要 - 1 -
一、问题的重述 - 2 -
二、问题分析与建模思路 - 2 -
三、基本假设与符号说明 - 3 -
3.1 基本假设 - 3 -
3.2 符号说明 - 3 -
四、模型的建立与求解 - 4 -
4.1功率谱和信噪比的计算方法 - 4 -
4.1.1 基于Voss映射求解功率谱和信噪比方法 - 4 -
4.1.2 基于Z-curve映射求解功率谱与信噪比方法 - 7 -
4.1.3 基于实数映射求解功率谱与信噪比方法 - 10 -
4.2 对不同物种类型基因的阈值确定 - 11 -
4.2.1 人类基因序列阈值的确定 - 11 -
4.2.2 鼠类基因序列阈值的确定 - 13 -
4.3 基因识别算法的实现 - 16 -
4.4 延展性研究 - 20 -
五、模型评价与改进 - 21 -
六、参考文献 - 22 -
七、附录 - 23 -
参赛密码
(由组委会填写)
第九届“华为杯”全国研究生数学建模竞赛
题 目 基因识别问题及其算法的研究
摘 要
在生物学、医学、药学等诸多方面,DNA的研究都具有重要的理论意义和实际价值。在面对大量、复杂的基因序列数据时,如何更好更快捷地获取准确的基因信息,如何能够在众多的基因序列中确定功率谱和信噪比,如何能够对每类基因快速地得到其阈值确定方法,如何快速实现基因识别算法,是摆在我们面前的一个具有研究意义的实际课题。
我们运用计算机MATLAB软件,分析结果如下:
对于问题一,我们根据文献中给出的Voss映射,用快速傅里叶变换方法来实现功率谱和信噪比的求解。本文利用附件中的genes6中的数据,运行第1条DNA片段的基因数据,通过编程分析,得到功率谱和信噪比r =3.4474。在Z-curve 映射下我们得到功率谱和信噪比r = 4.5965,并发现二者呈现一定的常数比例关系。在实数映射下,我们得到功率谱和信噪比为r =3.1186。
对于问题二,假定运行的数据拥有足够的长度。首先根据快速傅里叶变换方法,运行相关程序得到在不同基因片段时能够得到的信噪比,然后将得到的信噪比进行数据分析与整合;其次,把外显子和内含子的功率谱都运行出来;最后将外显子和内含子内部结构已知的8个人类和92个鼠类的信噪比进行分类,找出2者的信噪比并确定以何种信噪比作为标准。我们预测到人类的基因序列组合信噪比为R=1.5861,鼠类的基因序列组合信噪比为R=1.7503。
对于问题三,我们假定3-周期性具有一定的普遍性。采用相邻峰值频谱差异法确定外显子的起点和终点。首先,画出genes6中的DNA序列功率谱图像;其次,截取总片断中呈3的倍数的小片段,逐步测验,得到不同的频谱图;第三,在基因片段N/3和2N/3处取峰值;最后,根据3-周期性,得到基因片段的两处端点。
对于问题四,我们运用的是频谱和信噪比方法探讨基因突变。首先利用genes200数据,得到信噪比;其次做描述性统计分析,得到基因序列信噪比折线图和描述统计表;最后预测到当R值突然高于周围值时,基因失去DNA片段的对称性,这样的片段就会存在基因突变。
创新点:1. 利用快速傅里叶变换代替傅里叶变换,并用程序运行,大大提高了基因功率谱和信噪比的运算速度,对于今后研究具有现实性意义和参考价值。
2. 运用信噪比的取值探讨基因识别方法。
关键词:Voss映射 Z-curve 映射MATLAB软件 SPSS软件 快速傅里叶变换
一、问题的重述
DNA是生物遗传信息的载体,DNA分子是一种长链聚合物,DNA序列由腺嘌呤(Adenine, A)(Guanine, G)(Cytosine, C)(Thymine, T)(nucleotide)DNA片段称为基因(Genes)DNA序列片段,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。如何利用DNA这些重要的信息帮助人们在农业、工业等行业领域内实现新的突破是我们面临的一个新的实际课题。我们就当前国内外的研究现状与成果的相关情况,建立数学模型分析研究下面的问题:
问题一:
(1)Voss映射,探求功率谱和信噪比的计算方法。
(2)Z-curve 映射,求解频谱与信噪比并对Z-curve 映射和Voss映射下的频谱和信噪比进行比较。
(3)genes6的编码区域的预测。
问题四:
利用频谱或信噪比方法去发现基因编码序列可能存在的突变。
二、问题分析与建模思路
问题一:
(1)Voss映射,采用傅里叶方法探求功率谱和信噪比的快速计算办法。本文利用附件中的genes6中的数据,运行给定的任意一段基因数据,在给定的一段DNA序列片段为S = ATCGTACTG,则所生成的四个0-1序列分
您可能关注的文档
最近下载
- 初级育婴员初级育婴员ppt课件完整版.pptx VIP
- 2023年山东省曲阜市中考物理真题(历年真题)附答案详解.docx VIP
- 杜邦TPO防水衬垫系统超详细介绍.pdf VIP
- 2025儿童康复医学专业医疗质量控制指标专家建议解读课件.pdf
- 《事业单位工作人员处分规定》(2023)课件.ppt VIP
- GB50032-2003:室外给水排水和燃气热力工程抗震设计规范.pdf VIP
- 2026年上海高三物理高考重点知识点归纳总结(复习必背) .pdf
- 化工过程安全管理导则AQT 3034—2022知识培训.pptx VIP
- 天然气分输站流程整改施工方案.doc
- YY_T 1910-2023 用于增材制造的医用β-磷酸三钙粉末.pdf
文档评论(0)