说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
ICS 35.240.80 C 07 团体标准 T/CHIA 21.1-2021 组学样本处理与数据分析标准 第1部分:全基因组测序数据分析 Specification of omics sample processing and data analysis Part 1:whole genome sequencing analysis 2021-07-11发布 2021-08-01实施 中国卫生信息与健康医疗大数据学会 发布 全国团体标准信息平台 T/CHIA 21.1-2021 I 目 次 前言 ................................ ................................ ................................ ................................ .................. II 引言 ................................ ................................ ................................ ................................ ................. III 1 范围 ................................ ................................ ................................ ................................ ............... 1 2 规范性引用文件 ................................ ................................ ................................ ........................... 1 3 术语和定义 ................................ ................................ ................................ ................................ ... 1 4 全基因组测序数据相关文件格式 ................................ ................................ ............................... 2 5 全基因组分析流程 ................................ ................................ ................................ ....................... 4 6 全基因组数据的个性化分析 ................................ ................................ ................................ ....... 6 全国团体标准信息平台 T/CHIA 21.1-2021 II 前 言 本文件按照 GB/T 1.1 -2020给出的规则起草。 T/CHIA 21《组学样本处理与数据分析标准》 分为以下五 部分: ――第1部分:全基因组测序数据分析; ――第2部分:全外显子组测序数据分析; ――第3部分:转录组样本处理; ――第4部分:转录组文库构建; ――第5部分:转录组测序数据分析。 本文件为T/CHIA 21的第1部分。 本文件由中国科学院北京基因组研究所(国家生物信息中心) 提出,由中国卫生信息 与健康大数据学会 归口。 本文件起草单位: 中国科学院北京基因组研究所(国家生物信息中心) 、中国科学院 生物物理研究所、 浙江大学、复旦大学、清华大学、中国人民解放军总医院、 北京蛋白质 组研究中心、中国科学院微生物研究所、 北京大学人民医院、中国科学院上海 营养与健康 研究所、中南大学、 空军军医大学(第四军医大学) 和华为技术有限公司 。 本文件主要起草人: 方向东、 陈润生、金力、何昆仑、李亦学、张学工、 何顺民、段 会龙、周水庚、渠鸿竹、龚尚瑾、隋阳、王霞、 吕旭东、朱云平、 马俊才、杨忠、石乐明、 吴松峰、吴林寰、王振、陈先来、 贾志龙、 张昭军、娄晓敏、阮修艳、单广乐、 乔楠、刘 登辉、丁子建 。 全国团体标准信息平台 T/CHIA 21.1-2021 III 引 言 《组学样本处理与数据分析标准 第1部分:全基因组测序数据分析》为全基因组数据 分析提供一套术语规范、定义明确、语义语境无歧义的流程规范,防止流程缺项、术语不 规范、配置不合理等问题。 本文件依据目前已有的开源软件、部分常见服务器供货商、以及自产的中国人全基因 组数据,搭建全基因组数据分析流程、从准确性、速度、以及使用便利性方面评估不同流 程的性能,最终形成全基因组数据分析流程规范。 为了及时反映全基因组数据分析流程的变化情况,本文件将不断更新以符合当前的实 际情况。 全国团体标准信息平台 T/CHIA 21.1-2021 1 组学样本处理与数据分析标准 第1部分:全基因组数据分析 1 范围 本文件规定了全基因组数据分析流程中涉及的术语和定义。 本文件适用于全基因组数据分析。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的,凡是注日期的引用文件,仅注日期的版本 适用于本文件。 凡不注日期的引用文件, 其最新版本 (包括所有的修改单) 适用于本文件。 GB/T 30989高通量基因测序技术规程 GB/T 35533染色体异常检测基因芯片通用技术要求 GB/T 35890高通量测序数据序列格式规范 3 术语和定义 下列术语和定义适用于本部分。 3.1 全基因组测序 whole genome sequencing 是高通量测序技术下一代测序技术 NGS(Next -Generation Sequencing) 的一种, 利用高通 量测序平台对某一个体的全部基因组序列进行测序。 3.2 测序片段 reads 高通量测序平台产生的含有碱基序列和质量值的序列片段。 [GB/T 35890 —2018 ,定义 3.2] 3.3 FASTQ格式 fastq format FASTQ是基于文本的、保存生物序列(通常是核酸序列)和其测序质量信息的、每四 行表示一条序列的标准格式。 [GB/T 35890 —2018,定义 3.9] 3.4 质量控制 quality control 测序数据的质量好坏会影响数据的下游分析, 对测序仪下机的原始数据进行质量评估, 具体内容包括含 N比例、 GC含量、 duplication 情况、序列长度分布情况、碱基平衡情况等 。 3.5 参考基因组 reference genome 全国团体标准信息平台 T/CHIA 21.1-2021 2 参考基因组是由科学家组装的一个数字核酸序列数据库,代表一个物种理想条件下基 因集合的所有信息。 3.6 GATK the genome analysis toolkit 由布罗德研究所的数据科学平台开发的工具包, 内含多种基因组分析工具,可广泛应 用于人类和其他物种的数据分析。目前, GATK已经成为了基因组寻找变异的行业标准。 3.7 变异 variation 变异是生物体、病毒或染色体 外DNA基因组核苷酸序列的改变。包括单核苷酸变异、 核苷酸小片段插入与缺失变异和结构变异。 3.8 基因分型 genotyping 利用生物学检测方法测定个体基因型( Genotype )的技术,主要对变异的纯合和杂合 性进行判断。 3.9 注释 annotation 对找到的变异进行注释, 确定变异在染色体上的位置 ,是哪个基因发生突变 以及相关 蛋白质的变化情况 等信息。 3.10 从头组装 de novo assembly 从头组装可以将原始 reads拼接成较长的 contigs序列,基于 contigs和参考基因组的比对 结果进行变异识别,可以增加识别的准确度,实现更加全面的短插入缺失变异以及结构变 异的检测 。 4 全基因组测序数据相关文件格式 4.1 Fastq格式文件 Fastq文件中储存的是测序原始 下机数据,包含测序序列的序列信息及其对应的测序质 量,具有独特的格式
T-CHIA 21.1—2021 组学样本处理与数据分析标准 第 1 部分:全基因组测序数据分析
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 思安 于
2022-12-13 11:53:29
上传分享
举报
下载
原文档
(596.5 KB)
分享
友情链接
GB-T 22040-2008 公路沿线设施塑料制品耐候性要求及测试方法.pdf
GB-T 33982-2017 分布式电源并网继电保护技术规范.pdf
GB-T 26119-2010 绿色制造 机械产品生命周期评价 总则.pdf
GB-T 12727-2023 核电厂安全重要电气设备鉴定 IEC IEEE 60780-323-2016.pdf
T-CAGHP 016—2018 地质灾害监测仪器物理接口规定 试行.pdf
GB-T 29505-2013 硅片平坦表面的表面粗糙度测量方法.pdf
专利 一种知识图谱更新方法、装置、设备及存储介质.PDF
JY-T 0583-2020 聚焦离子束系统分析方法通则.pdf
GB-T 34969-2017 彩色激光打印机测试版.pdf
GB-T 21141-2007 防沙治沙技术规范.pdf
悬镜安全子芽 浅谈DevSecOps敏捷安全发展趋势 2021.pdf
ISO IEC TS 25058 2024 Systems and software engineering — Systems a.pdf
GB-T 38395-2019 煤焦油 硫和氮含量的测定.pdf
T-CPIA 0047—2022 光伏柔性支架设计与安装技术导则.pdf
GB-T 37736-2019信息技术云计算云资源监控通用要求.pdf
GB-T 40113.1-2021 生物质热解炭气油多联产工程技术规范 第1部分:工艺设计.pdf
T-AIF 001—2020 科创企业团体标准.pdf
T-CECS G:D60-02—2023 公路超高性能混凝土 UHPC 桥梁技术规程.pdf
DB3302-T 165-2018 杨梅矮化早果丰产栽培技术规程 宁波市.pdf
GB-T 3620.1-2016 钛及钛合金牌号和化学成分.pdf
1
/
3
12
评价文档
赞助2.5元 点击下载(596.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。