- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
宏基因组数据处理和加工要求
1范围
本文件规定了宏基因组数据处理和发布的要求,以及功能分析前的数据处理的质量评价/评估,包括
对宏基因组数据处理的类别定义、处理流程、数据格式、和质量评估提出了要求。
本文件适用于各级别科研机构、临床研究机构和第三方服务机构、科研服务企业以及使用同行评估
的项目确认或认可数据发布和信息共享中数据管理的能力。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其必威体育精装版版本(包括所有的修改单)适用于本
文件。
ISO20691:2022《生物技术-生命科学中对下游数据处理和集成工作流的数据格式化和描述的需求》
ISO/TS24420:2023《生物技术-大规模并行DNA测序-鸟枪法宏基因组数据处理通用要求》
3术语和定义
下列术语和定义适用于本文件。
3.1
宏基因组Metagenomics
对特定环境的整个微生物群落进行的研究,此研究直接提取环境样品中所有微生物的DNA而不进
行分离和培养,并分析遗传组成,物种分类,系统发育,基因功能和代谢网络。
3.2
元数据Metadata
关于数据的数据。
3.3
生物项目bioproject
关于一个测序项目的所有数据的信息。
3.4
生物样本biosample
关于一个测序样本的所有信息。
3.5
生物实验bioExperiment
关于一次测序实验的所有信息。
3.6
组装Assembly
在测序后从短序列形成完整基因的过程。
3.7
数据格式Dataformat
根据预设规格进行的数据排列(通常用于计算机处理)。
3.8
碱基质量Qualityscore
碱基识别出错概率的整数映射。
3.9
Q50
测序数据中识别质量值大于50的碱基比例。
3.10
原始数据Rawdata
测序仪产生的初级测序数据。
[来源:ISO20397-2,3.21]
3.11
衍生数据deriveddata:
利用原始数据进行分析后得到的数据。
3.12
丰度abundance
一种微生物在环境中的总微生物群落中的相对比例,通常表现为百分比。
4宏基因组数据描述要求
4.1宏基因组元数据描述要求
4.1.1元数据表示对宏基因组测序的特征、内容、相关联系人、以及所产生的数据的方法、质量控制等
进行描述的内容。通常包括宏基因组测序的项目、样本、测序实验的描述信息。
4.1.2生物项目描述信息(附录A.1)包括项目的名称、范围和内容、并记录项目的联系人等贡献者信
息。项目名称应当准确描述项目的主要特征。
4.1.3生物样本描述信息(附录A.2)包括样本的采集时间、地点、样本的内容及相关联系人信息。应
当建立标准化的环境采集特征,推荐使用由GSCGenomicStandardsConsortium发布的国际通用的环境
包用于环境特征EnvironmentOntology的描述。
4.1.4生物实验描述信息(附录A.3)应当包括样本处理的描述、建库测序方法和参数等详细信息。能
够通过控制词表进行规范化描述的内容应当尽量建立词表来进行描述,如测序平台、建库方法等信息的
控制表。
4.2宏基因组测序原始数据描述要求
4.2.1宏基因组测序原始数据是指直接利用测序仪器所产生的文件,包括序列字符及对应的碱基质量,
用于进行数据的后续分析。
4.2.2原始数据通常根据测序平台的不同,可以以多种标准化的方式进行存储,例如Binary
Alignment/Map[BAM],CompressionReducedAlignment/Map[CRAM]或者Fastq等文件。序列文件存储
的格式应当在序列描述中进行说明。
4.3宏基因组衍生数据描述要求
4.3.1衍生数据包括利用原始数据进行拼接、物种注释、功能注释等分析,并形成的结果。
4.3.2衍生数据应当记录分析用的软件名称、版本号及参数。
4.3.3拼接后数据,应当明确标识contigs,scaffolds,或者染色体chromosomes等拼接后的状态。
4.3.4物种注释应当记录比对上的物种名称及丰度,比对的物种名称应当使用准确的分类名称(门、纲、
目、科、属、种或未分类)
4.3.5功能注释应当记录注释用的参考数据
您可能关注的文档
- 高压直流系统 交流滤波器规范和设计评估导则 第1部分:概论-必威体育精装版国标.pdf
- 便携式割灌机和割草机 切割附件安全罩 强度-必威体育精装版国标.pdf
- 高压直流系统 交流滤波器规范和设计评估导则 第4部分:设备-必威体育精装版国标.pdf
- 手持便携式林业机械 可循环再利用性和可回收再利用性 计算方法-必威体育精装版国标.pdf
- 新风热回收通风机组和能量回收通风机组 季节性能系数测试计算方法 显热供热热回收季节性能系数-必威体育精装版国标.pdf
- 动物炭疽诊断技术-必威体育精装版国标.pdf
- 纺织机械及附件 倍捻机 术语-必威体育精装版国标.pdf
- 科学数据收割规范-必威体育精装版国标.pdf
- 道路工程混凝土结构表层渗透防护技术规范-北京标准.pdf
- 用水定额 第3部分:果树-北京市标准.pdf
- 半导体器件 第5-11部分:光电子器件 发光二极管 辐射和非辐射电流的测试方法-必威体育精装版国标.pdf
- 船舶通用术语-必威体育精装版国标.pdf
- 基于运动图像跟踪技术的液体混合燃料微爆特性测试方法-必威体育精装版国标.pdf
- 配电网通用技术导则-必威体育精装版国标.pdf
- 工业硫酸-必威体育精装版国标.pdf
- 天然纤维增强塑料复合(NFC)板试验方法-必威体育精装版国标.pdf
- 土工合成材料 聚乙烯土工膜-必威体育精装版国标.pdf
- 畜禽遗传资源调查技术规范 第7部分:骆驼、羊驼-必威体育精装版国标.pdf
- 家蚕遗传资源调查技术规范-必威体育精装版国标.pdf
- 柞蚕遗传资源调查技术规范-必威体育精装版国标.pdf
最近下载
- GB 50487-2008 水利水电工程地质勘察规范 (2022年版) .docx VIP
- 【低空经济】低空经济教学课程设计方案.docx
- 2025至2030中国冷链物流行业运营效率与成本控制研究报告.docx
- 2020年《毛泽东思想和中国特色社会主义理论体系概论》考试试卷及答案(一).doc VIP
- 2025入团积极分子考试题库(含答案).docx VIP
- 2021年模拟试题版10月自学考试12656毛泽东思想和中国特色社会主义理论体系概论历年模拟试题.doc VIP
- (2025)廊坊市入团积极分子考试题库(含答案).docx VIP
- 2025至2030中国冷链物流无人机配送网络建设与运营成本测算研究报告.docx
- 晶源微一级代理商CSC2313F深圳恒锐丰科技.pdf VIP
- 2024北森整理题库(言语理解、资料分析、图形推理.).docx VIP
有哪些信誉好的足球投注网站
文档评论(0)