- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华大医学执行总裁尹烨:基因大数据2014.03.08
尹烨:华大医学执行总裁。尹烨,1979年生,籍贯山东烟台。2002年毕业于大连理工大学生物工程专业获学士学位,?2013年获华南理工大学生物工程(基因组学)工程硕士学位。2002年加入华大基因,先后从事体外诊断试剂研发、管理及基因组研究行业,曾任华大科技总裁,华大集团首席运营官(COO),现任华大医学总裁,率领团队积极推动前沿生物医学技术和基因组学研究成果的临床应用,降低出生缺陷及其他重大疾病对人类健康的危害。
以下为分享实景全文:
各位好,华大基因的尹烨。基因这个词一直是我非常喜欢的词,也是英文翻译的最好的词,gene-基因,基因基因,基本之因。
第一个话题,基因,基因组,大数据。对于目前我们已知的生物圈,碳链作为基本骨架的生命,我们都是通过DNA来进行遗传的。基因可以简单的理解成一段有意义的DNA序列,而全部的DNA就成为一个物种的基因组。
地球诞生了46亿年,最早的细胞化石是30亿年,我们从简单到复杂,从水生到陆生,从低等到高等,从无性到有性,从单细胞到多细胞……
我只能说部分同意进化论,但是关于生命的起源,的确是一个争议很大的学科。
但分析现有的物种(包括部分灭绝的),从DNA的角度来看,的确有着极强的进化或演化关系,我们称之为同源性。
最简单的基因组来自于病毒,比如乙型肝炎病毒的DNA总量(基因组大小)只有3.2Kb.然后到了细菌,比如大肠杆菌,基因组就有4Mb,而到了酵母,也就是真菌就有了10Mb。他们的基因组不断的插入外源DNA,越来越大,功能也越来越多。然后高等真菌已经有30Mb-80Mb?的基因组了,到了最简单的植物也只有100Mb左右的基因组,比如拟南芥。再向上,比如梅花200Mb,水稻400Mb,大豆1Gb,两爬类2Gb,哺乳类3Gb。所以人类的基因组也就是3Gb,即30亿个碱基。
然而还有更大的,比如辣椒在3G以上,而大麦要5G-6G,大蒜10G,小麦16G,银杏20G……肺鱼50G-100G。
基因组的大小与物种进化高低并无一致性,我们称为C值悖论,或者说很多物种仍然是处于进化状态的。全世界(范围内),我们基本的预估,所有生命信息只测一次的数据量是?10的60次方,然而现在只有10的21次方-22次方左右。以人类举例,这个群体有70亿数量,如果每人都测一次,则测序的数据量至少就是3Gb*70亿这么大。且受到技术和方法学限制,目前每一个人至少要测100G(大约是基因组的30倍),才能得到相对准确的全基因组信息,所以刚才的数量就达到了100G*70亿人次这么大。
水稻,玉米,小麦……这些都要育种,每一个也都需要按照这样的方式来做,所以这个数据量就变得无可估量了。现在是从每个物种只测一次的角度来讲,而对于活着的生命体,还需要测很多次,比如每个人睡觉、吃饭、思考、生病的基因表达都不一样,这个数据量还会有数量级的增加。
存活不到“一秒”的人类个体有多大数据?这里说的一秒是指把生命出现到现在当作一年时间来看。
所以你会发现,原来我们还有基因组万倍的细胞,还有十万倍的菌群。这些如果都测出来,那是不得了的数据量。
我们计算过,一个人如果从出生下来就开始取样,生化、免疫、影像、基因,表型数据,如果都开始积累,那么一起步就是665个G,一辈子差不多就到了1个P。如果一个人1P,1000人就是1E,1M(Million)人就是1Y,1B(Billion)人就是1个Z,这就是10的24次方。这个数据还只是人类,如果把上千万个物种,都这样来一下,那么可能就达到了N或者D的级别。
大家看这个,如果说20世纪是物理学世纪的话,那么21世纪毫无疑问的就是生命的世纪。物理在有了热力学三大定律特别是熵的概念提出后,开始进入快速发展阶段。生命科学至今还没有一个可以用数学语言可以阐述的定律。
看下这张,生命科学从1859年物种起源来看,不过就是150年的时间。基因也是1911年才出现的提法。迄今为止,全世界已经测序完成的高等动植物基因组大概有800个,华大贡献了70%。
基因数据这对于这个行业来讲就是巨大的油田。
一个行业如果要兴起,需要经过科学发现,技术发明,再到产业发展。比如富兰克林发现了电,爱迪生发明了电灯,而GE把照明做到了全世界。制造业包括IT,一般可以直接从发明到发展,所有学科里面唯独生命不行。这是因为,生命科学直接作用于人体,即使你知道了青蒿素可以治疗疟疾,但一定要从机理上证明,即回归发现,才可以允许你做产业发展。而生命的科学发现,必须依赖于大数据,重视相关关系,而不是因果关系。
美国在1980年启动了肿瘤大战,希望通过蛋白等片段的信息来搞清楚肿瘤,十年后发现失败。所以在1990年正式启动了人类基因组,不去搞明白为什么,而是先把whole?picture搞定,即解决是什么的
您可能关注的文档
最近下载
- 土方开挖工程专项施工方案.docx VIP
- SN/T 4746-2017_进出境水生动物消毒技术规范.pdf VIP
- 四年级上册《综合实践活动》人教版全册简洁教案.pdf VIP
- 2025年园艺花卉电商冷链物流冷链运输车辆与路径优化研究报告.docx
- 高中数学必修一(人教A版2019课后习题答案解析.docx VIP
- 2025呼和浩特市文化旅游投资集团有限公司第二批次招聘笔试历年参考题库附带答案详解(10卷合集).docx
- 慢性心力衰竭老年患者6分钟步行试验评估与活动指导考试试题.docx VIP
- 个人简历模板空白表格word下载.doc VIP
- 江西省南昌市第二中学2024-2025学年高一上学期语文新生入学考试试卷(含答案).pdf VIP
- 井上、下防灭火安全技术措施.docx VIP
文档评论(0)