ICS35.030 CCS L 80 GE 中华人民共和国国家标准 GB/T41807—2022 信息安全技术 声纹识别数据安全要求 Information security technology- Security requirements of voiceprint recognition data 2022-10-12发布 2023-05-01实施 国家市场监督管理总局 发布 国家标准化管理委员会 GB/T41807—2022 目 次 前言 1 范围 2 规范性引用文件 3 术语和定义 概述 4 典型场景 4.1 4.2 典型风险 基本安全要求 5 6 数据收集 6.1 通用要求 6.2 身份识别应用 6.3 非身份识别应用 6.4 科学实验与测试 数据存储和传输 7.1 通用要求 7.2 身份识别应用 7.3 非身份识别应用 数据使用 8.1 通用要求 8.2 科学实验与测试 数据提供 9.1 通用要求 9.2 身份识别应用 9.3 非身份识别应用 9.4 科学实验与测试 10 数据公开 数据删除 11 11.1 通用要求 11.2 科学实验与测试 附录A(资料性) 声纹识别数据安全风险分析 附录B(资料性) 知情同意书示例 01 参考文献 15 GB/T 41807—2022 前言 本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由全国信息安全标准化技术委员会(SAC/TC260)提出并归口。 本文件起草单位:北京得意音通技术有限责任公司、中国电子技术标准化研究院、清华大学、北京微 呼科技有限公司、国民认证科技(北京)有限公司、北京百度网讯科技有限公司、北京曙光易通技术有限 公司、西安银行股份有限公司、科大讯飞股份有限公司、云从科技集团股份有限公司、海信集团控股股份 有限公司、北京眼神科技有限公司、中国信息通信研究院、北京中盾安信科技发展有限公司、公安部第三 研究所、国家工业信息安全发展研究中心、北京软件产品质量检测检验中心、北京远鉴信息技术有限公 司、北京银联金卡科技有限公司、京东科技控股股份有限公司、厦门天聪智能软件有限公司、蚂蚁科技集 团股份有限公司、北京小来移动软件有限公司、联想(北京)有限公司、中国电信集团有限公司、厦门大 学、上海掌数科技有限公司、北京声智科技有限公司、银河水滴科技(北京)有限公司、数据堂(北京)科技 股份有限公司。 本文件主要起草人:郑方、邬晓钧、郝春亮、黄小妮、王小钢、许晓耕、徐明星、胡影、刘亦珩、李俊、 王洋、于雪平、长孙菲、马方钟、李军、高雪松、杨春林、傅山、王开林、李美桃、孔昊、戎玲、游寒旭、郑榕、 李博文、杨波、付立、雷文钿、林冠辰、李明菊、李汝鑫、曾然然、洪青阳、高星、陈孝良、张曼、谷晓霞、 王大亮、程星亮、陈聪、林阳荟晨、张瑾、 I GB/T41807—2022 信息安全技术 声纹识别数据安全要求 1范围 本文件规定了声纹识别数据的收集、存储、使用、传输、提供、公开、删除等活动中,对数据处理者的 安全要求。 本文件适用于规范数据处理者的声纹识别数据处理行为。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文 件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于 本文件。 GB/T25069 信息安全技术 术语 GB/T35273 信息安全技术 个人信息安全规范 GB/T 37988 信息安全技术 数据安全能力成熟度模型 GB/T39335 信息安全技术 个人信息安全影响评估指南 GB/T40660 信息安全技术 生物特征识别信息保护基本要求 GB/T41479 信息安全技术 网络数据处理安全要求 3术语和定义 GB/T25069、GB/T35273、GB/T37988、GB/T40660和GB/T41479界定的以及下列术语和定义 适用于本文件。 3.1 声纹识别数据主体 voiceprint recognition data subject 声纹识别数据所对应的特定自然人。 注:本文件中简称“数据主体”。 3.2 语音样本 speech sample 语音的模拟表示或数字表示。 注:直接从数据主体收集的语音样本中蕴含数据主体的声纹。 3.3 声纹 文voiceprint 人的语音中所蕴含的、能用以表征和标识数据主体的生物学特性和行为特性的总称。 3.4 声纹语音样本 voiceprint speechsample 可提取声纹的语音样本。 注1:智能语音交互过程中所收集的语音样本如未经过特殊处理,可提取声纹,属于声纹语音样本。 1 GB/T41807—2022 注2:采用参数合成方法生成的语音样本不蕴含声纹,不属于声纹语音样本。 注3:声纹语音样本是一类生物特征样本,生物特征样本见GB/T5271.37一2021。 3.5 声纹特征项 voiceprintfeature 从声纹语音样本中提取的用于声纹识别的参数。 注1:常用的声纹特征项参数包括频谱(spectrum)、倒频谱(cepstrum)、线性预测系数(LPC)、音高(pitch)、声调 (tone)、共振峰(formant)、音质(voicequality)、声韵(prosody)等各种层次的信息。 注2:声纹特征项具有不可逆性,无法还原出声纹语音样本。 3.6 声纹模型 voiceprint model 对具体某个数据主体的声纹特征项进行描述的数学模型。 注1:常用的数学模型有高斯混合模型(Gaussianmixturemodel)、隐马尔可夫模型(hiddenMarkovmodel)、支持向 量机(supportvectormachine)等。 注2:一些数学模型可以生成表征和标识数据主体的参数,这些参数常常对应具体某个数据主体的模型参数的取 值,也简称为声纹模型。 3.7 声纹识别数据 voiceprintrecognitiondata 声纹语音样本及其处理得到的,可单独或结合其他信息识别数据主体的数据, 注:声纹识别数据包括声纹语音样本、声纹特征项和声纹模型, 3.8 声纹数据分析 voiceprint data analysis 对声纹语音样本进行统计、检测或特征分析的活动。 注:声纹数据分析的典型应用包括但不限于会议发言人数统计、人声美化、识别数据主体的年龄、性别、口音、情感、 健康信息等。 3.9 语音唤醒 speechwakeup 处于音频流监听状态的语音交互系统,在检测到特定的特征或事件出现后,切换到交互指令识别、 连续语音识别等其他工作状态的过程。 [来源:GB/T36464.2—2018,3.13 4概述 4.1典型场景 4.1.1 应用场景 4.1.1.1身份识别应用 身份识别应用场景是指声纹识别数据用于识别数据主体身份的场景。在此场景中处理的数据包括 声纹语音样本、声纹特征项和声纹模型,通常还包括其他个人信息。 典型应用场景如:移动设备声纹解锁屏、声纹门禁、声纹锁、远程声纹身份鉴别等。 4.1.1.2非身份识别应用 非身份识别应用场景是指应用场景涉及声纹语音样本,但未用于识别数据主体身份的场景。在此 场景中处理的数据是声纹语音样本,可能包括其他个人信息 典型应用场景如:提供智能语音技术应用,业务场景中收集的语音样本包含声纹,但不涉及使用声 2 GB/T41807—2022 纹进行身份识别,包括智能音箱语音唤醒、智能语音系统交互、自动语音翻译、声纹数据分析等。 4.1.2非应用场景 非应用场景主要是科学实验与测试场景,它是指声纹识别数据用于开展与语音有关的科学实验活 动和产品测试的场景。在此场景中处理的数据包括声纹语音样本、声纹特征项和声纹模型,通常还包括 其他个人信息。当数据处理者收集声纹语音样本时,可能会引人第三方和其他数据处理者。 典型应用场景如:科研机构(数据处理者)委托第三方收集或标注声纹语音样本并开展研究工作,包 括高校进行声纹技术处理研究,学术团体开展算法竞赛和评比等;检测机构(数据处理者)开展算法或产 品评测等。 4.2典型风险 声纹识别数据处理活动中常见的安全风险主要包括数据的滥采滥用,数据提供给未获授权同意的 第三方,以及数据传输过程中被监听和攻击导致语音样本泄露等。具体处理活动风险分析见附录A。 5基本安全要求 对声纹识别数据处理者的基本安全要求如下。 a)应符合GB/T35273、GB/T40660、GB/T41479规定的各项要求。 b) 组织机构数据处理者应按照GB/T37988达到数据安全能力成熟度3级以上要求 c)天 开展声纹识别数据处理活动前,应按照GB/T39335的规定开展个人信息安全影响评估,并形 成评估报告。 d)开展声纹识别数据处理活动实现产品或服务功能时,应具有明确的、必要的、难以通过其他技 术替代的、直接服务于数据主体的处理目的,并确保不将声纹识别数据用于与该目的无关的其 他数据处理活动, e)[ 除有远程处理的必要,应仅在本地进行处理。 f) 处理未成年人声纹识别数据的,应取得其父母或监护人的单独同意。 注1:本文件中的未成年人按照《中华人民共和国个人信息保护法》第三十一条指不满十四周岁未成年人。 g) 数据主体为未成年人的,或者应用了未成年人模式的,应制定专门的声纹识别数据处理规 则,内容包括但不限于: 1)未成年人声纹识别数据的处理目的和处理方式,确保不涉及生命健康、财产安全; 2) 处理的未成年人声纹识别数据种类和保存期限
GB-T 41807-2022 信息安全技术 声纹识别数据安全要求
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思安 于 2022-11-13 13:20:01上传分享