- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高通量数据处理的一些经验和建议
最近一年时间里收到很多同学和朋友关于454数据处理的询问,通过QQ,微信,人人网和邮件等各种途径,当然不少也是面对面的讨论。这些同学和朋友包括同组的,跨组的,同所的,跨所的,其他大学的,来自北京的、南京的、广州的、西安的,甚至也有国外的中国朋友。有些朋友我素未谋面,也不知长相如何,不知男女。有时候同一天能收到五六份邮件,问题之五花八门,有时已经超越了我所能够解答的范围。
这些现象也反映了当前生物信息学的急剧变革,第二代测序技术就像Iphone问世一些,彻底席卷和重新定义了当前生态学研究的方法和手段。而几年前费用昂贵的第二代测序如今已“旧时王谢堂前燕,飞入寻常百姓家”,于是乎大潮裹挟之下的硕士生博士生们都想出来耍耍,扔个十几万块钱,希望能够轻松的收获几篇文章。
科研论文的发表讲究“猎奇性”,大家都喜欢看到新奇的方法和漂亮的图表。但我认为这其实也是当今科研界的弊端之一,讲究创新和手段的先进,而忽视了研究的重要性。以微生物生态学的旗舰杂志ISMEJ为例,最近一年多发表的学术论文里,第二代测序技术已经是寻常方法,所谓第三代的单细胞测序技术也开始出现。研究生物信息学的来自美国科罗拉多的Rob Knight能够作为ISMEJ的高级主编,方法对于微生物生态学研究的重要性可见一斑。
前几天读到阿伯丁大学的James Prosser教授在Nature上发表的一篇观点文章“Think before you sequence“,在这里面他讲到,第二代测序只不过是一个工具而已,我们的研究依旧要从扎扎实实的假设出发,设计实验来解决问题和验证假设。高通量测序并不能弥补实验设计的缺陷。我在阅读文章的过程中也发现,设计合理和完整的实验,即使使用传统的Sanger测序技术,依旧能够说明和解决问题,并能够发表到高档次期刊上。而如果使用第二代测序技术,但是数据处理有问题,数据质量控制不好,文章也很难得到发表,相当于花钱买罪受。
我从2011年秋天开始学习454数据的处理,在学习的起始阶段,能够和师弟袁超磊一起探讨和交流,并且几乎阅读了ISMEJ上所有与第二代测序技术有关的文章,所以能够很快的上手。在此我也对师弟袁超磊表示正式的感谢,祝愿他在阿德雷德大学能吃上可口的饭菜。
很多朋友的问题我未能一一解答,在此也表示歉意。我经历过学习454数据处理的漫长和痛苦的过程,我很清楚有时候一句话或者一段话很难解决所问的问题。去年我自己投出的文章经历了很多次的拒稿,十几位审稿人和生物信息学家对数据处理提出了建议,现在经过在悉尼和生物信息学专家的讨论,我也能够更加合理地看待数据处理的问题。摸着石头过河的一些经验和建议,在这里进行分享,希望正在摸索和思考中的你,觉得并不孤单。
1. Mothur和QIIME那个软件更好?
Mothur是美国密歇根大学的Patrick Schloss在2009年开发的数据处理平台,它的前身是Dothur软件,相信大家都听说过。这两个软件的发音分别为Mother和Daughter,是Dr Parick献给他的妻子和女儿的。另一个被广泛使用的数据处理平台是QIIME,也是美国科罗拉多Rob Knight等人于2009年开发出来的。截至今天,Mothur的方法文献已经被引用1229次,而QIIME被引用574次。这说明Mothur比QIIME有更广泛的群众基础。
我刚开始学习使用的就是Mothur,我个人非常喜欢这个开源的数据处理平台,基本能够实现我的所有数据处理目的。Mothur软件无需安装,在Windos, Linix,和MacOS系统上都可以运行。我研究了Mothur每一个中间导出文件的格式和原理,所以我能够将这些中间产生的文件导入其他软件进行处理和做图,比如R语言。很多人不喜欢Mothur,都是因为Mothur不能够直接出图,必须依赖于其他软件。而这正式我所喜欢的原因,我现在也正在进一步学习R语言,R的做图功能是非常强大的,其实大家平时看到文章上那些非常漂亮的图,大都是R语言做出来的。所以,如果将Mothur和R结合,我认为是一个能正确处理数据并完美展现数据的途径。除了罗氏454数据处理之外,Mothur现在也有了针对Illumina数据的处理方式,大家从Mothur的网页上就可以读到Dr. Patick写的标准数据处理流程。
现在QIIME携苹果电脑的时髦,也得到了很多人的青睐。这个软件我本人没有真正使用过,但是知道QIIME只能在MacOS和Linix系统上运行,当然也可以通过在Windos系统上安装Virtual Box来运行。这个软件出图的效果比较好,很多人把直接出的图用来发表文章。我所在的悉尼这边的研究所的生物信息学专家也是用QIIME来处理数据。我就这个软件问题和他讨论
文档评论(0)