ICS 13.310 CCS A 92 中华人民共和国国家标准 GB/T 41009—2021 法庭科学 DNA数据库选用的 基因座及其数据结构 Forensic sciences-Data structures of selected loci from the DNA database 2023-01-01实施 2021-12-31发布 国家市场监督管理总局 发布 国家标准化管理委员会 GB/T41009—2021 前言 本文件按照GB/T1.1一2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任, 本文件由中华人民共和国公安部提出。 本文件由全国刑事技术标准化技术委员会(SAC/TC179)归口。 厅、黑龙江省公安厅、浙江省公安厅、北京海华鑫安生物信息技术有限责任公司。 本文件主要起草人:刘冰、刘锋、刘超、孙辉、王彤、彭建雄、季安全、刘海、刘宏、王乐、尚蕾、康克莱、 吴微微、王剑、李效阳、郝宏蕾、徐曲毅、刘长晖、张喆、赵钊、田野、孙洁、李冬涛。 1 GB/T 41009—2021 法庭科学 DNA数据库选用的 基因座及其数据结构 1范围 本文件给出了建立法庭科学DNA数据库时所选用的人类染色体遗传标记类型及选用的短串联重 复序列基因座;规定了国家法庭科学DNA数据库与外部系统进行数据交换的文件格式、数据结构和基 本要求。 本文件适用于法庭科学DNA数据库建设,以及与法庭科学DNA数据库进行数据交换的外部系统 (如DNA实验室管理信息系统、DNA数据分析软件等)的设计、开发和测试。 2规范性引用文件 2 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文 本文件。 GB/T2312信息交换用汉字编码字符集基本集 GB18030信息技术中文编码字符集 3术语和定义 3 下列术语和定义适用于本文件。 3.1 基因座locus 染色体上基因所占的位置或基因组DNA中的一段。 [来源:GB/T37226—2018,2.2] 3.2 等位基因 allele 位于一对同源染色体的相同位置上的不同形式的基因。 3.3 短串联重复序列shorttandemrepeat;STR 一类广泛存在于真核生物基因组中,重复单位通常由2个~6个碱基构成,重复次数通常在5次~ 60次的DNA串联重复序列。 注:在人类基因组中,根据所处的染色体类型,又分为常染色体STR、Y染色体STR和X染色体STR。 3.4 重复区序列 repeat region sequence 短串联重复序列(3.3)中重复单位串联组成的部分,一般从第一个重复单位的5端,至最后一个重 复单位的3'端的序列。 1 GB/T 41009—2021 3.5 重复结构 repeat structure 重复区序列(3.4)中重复单位的组成形式。 4缩略语 下列缩略语适用于本文件。 DNA:脱氧核糖核酸(DeoxyribonucleicAcid) DDEM:DNA数据库通用交换信息(DNADatabaseExchangeMessage) NDNAD:国家法庭科学DNA数据库(NationalDNADatabase) XML:可扩展标记语言(ExtensibleMarkupLanguage) 5DNA数据库选用的基因座 5.1遗传标记的选择 法庭科学DNA数据库中的DNA分型数据采用人类染色体牙釉质蛋白(Amelogenin)基因、短串联 重复序列(STR)和线粒体DNA检测结果。 注:线粒体DNA检测结果的数据结构不在本文件中规定。 5.2基因座的选择 5.2.1A类基因座(核心基因座):录人法庭科学DNA数据库中的DNA分型数据中应包含的STR基 因座,应符合附录A~附录C的规定。 5.2.2B类基因座(优选基因座):DNA分型数据中包含全部A类基因座后,应优先选择的STR基因 座,应符合附录A~附录C的规定。 附录A~附录C的规定。 6DNA数据库通用交换信息文件 6.1文件用途及结构 法庭科学DNA数据库使用DDEM文件来实现与外部系统的信息交换。DDEM文件中,采用定义 信息包的方式实现数据向数据库的导人。以XML为参考,所有XML定义的数据类型,通过XML映 射概要均可映射到SQL92或SQL99定义的数据类型。 DDEM文件包含两部分:DDEM文件头(Header)和样品(Specimen),如图1。 DDEM文件头 样品1 样品2 样品3 .. ..... 图1DDEM文件结构 2 GB/T 41009—2021 用GB18030中规定的字符,中文字符用2个字节表示。 当一个基因座的两个等位基因数值(AlleleValue)相同时,应分别表示。 6.2 2DDEM文件头 DDEM文件头部分包含如下信息: a)版本; b)1 信息类型; c) 授权录人实验室名称; d) 授权录人实验室ID; e) 信息源实验室名称; f) 信息源实验室ID; g) 录人人编号; h) 提交日期; i) 录人批次编号; j) 检测试剂产品名称; 检测试剂产品编号; 1) 试剂盒条码号; m) 测序仪厂商; n) 测序仪厂商ID。 6.3 3样品 DDEM文件样品部分包含如下信息: a) 样品编号; b))林 检验人编号; c) 案(事)件编号; d) 样品分类; e) 是否为部分分型; 样品注释; g) 基因座信息。 6.4 DDEM文件数据类型 DDEM数据文件类型及说明如下。 a)十进制型:代表任意精度的数字,XML文档中定义为十进制型的值定在SQL92或SQL99中 不被存储。 b)字符串型:由一组字符组成,字符可为任意字母、符号和数字,DNA数据库不支持管道符号“” 和半角分号“";某些符号在XML中有特殊含义,如“<”和>”,DDEM文件中如需使用这些 特殊字符时,则应以其他表示方式替代这些字符;替代表示方式应符合表1。 ) 日期/时间型:用于表示一个指定的时间,采用ISO8601子集格式,形式为“CCYY-MM DDTHH:mm:ss”,其中:CC”表示世纪,“YY”表示年,“MM”表示月,“DD”表示日,“T”为日 期与时间的分隔符,“HH”"mm”“ss”分别表示时、分、秒;如果需要更精确的表示时间,也可以 用分数形式表示秒,如"sS.ss.”,这种方式为可选;在SQL92或SQL99中,XML文档中存储 的日期以日期/时间型或短期/时间型方式存储。 3
GB-T 41009-2021 法庭科学 DNA数据库选用的基因座及其数据结构
文档预览
中文文档
39 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共39页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思安 于 2023-02-20 11:56:47上传分享