(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210481231.3
(22)申请日 2022.05.05
(71)申请人 杭州用九智汇科技有限公司
地址 310000 浙江省杭州市余杭区五常街
道西坝路51号B座217室
(72)发明人 邱伟峰 陆玉江 薛峰
(74)专利代理 机构 浙江英普律师事务所 3 3238
专利代理师 王炎军 齐润涵
(51)Int.Cl.
G06V 20/10(2022.01)
G06V 10/30(2022.01)
G06V 10/40(2022.01)
G06V 10/75(2022.01)
G06V 10/762(2022.01)
G06V 10/774(2022.01)G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种隐私图片识别方法
(57)摘要
本发明公开了一种隐私图片识别方法, 通过
将待测图片经过特征提取模块转换后的描述符
与隐私特征库中的描述符进行匹配, 当两者的距
离小于阈值, 则判断为命中, 当命中的数量大于
设定值, 将待测图片识别为与相应类别的隐私图
片。
权利要求书1页 说明书3页 附图1页
CN 114898209 A
2022.08.12
CN 114898209 A
1.一种隐私图片识别方法, 其特 征在于, 包括
特征提取模块, 所述特征提取模块用于提取标准化后的图片中的特征, 特征经过L2变
换后得到描述符, 每张标准 化后的图片可 得到为N个描述符, N 为正整数;
隐私特征库, 所述 隐私特征库包括标准化后的图片的描述符, 该标准化后的图片带有
类别;
通过将待测图片经过特征提取模块转换后的描述符与隐私特征库中的描述符进行匹
配, 当两者的距离小于阈值, 则判断为命中, 当命中的数量大于设定值, 将待测图片识别为
与相应类别的隐私图片。
2.根据权利要求1所述的隐私图片识别方法, 其特征在于, 还包括打分模块, 打分模块
用于筛选进行匹配的描述符。
3.根据权利要求1所述的隐私图片识别方法, 其特征在于, 所述隐私特征库中的描述
符, 包括预设图片的描述符和自定义图片的描述符。
4.根据权利要求1所述的隐私图片识别方法, 其特征在于, 对隐私特征库内同一类图片
的描述符进行聚类, 聚类时去除聚类异常的描述符。
5.根据权利要求1所述的隐私图片识别方法, 其特征在于, 将待测图片识别为隐私图片
后, 对隐私图片进 行验证, 如隐私图片和与其相匹配的图片在几何学上符合透视原理, 则验
证通过, 维持识别为隐私图片; 如不符合透 视原理, 则验证不 通过, 取消识别为隐私图片。
6.根据权利要求2所述的隐私图片识别方法, 其特征在于, 所述筛选方法为: 将待测图
片的描述符输入经过图片分类任务训练过的打分模块, 每个描述符输出一个分数, 按分数
从高到低排序, 选取 前K个分数对应的描述符作为匹配的对象, K为 正整数。
7.根据权利要求2所述的隐私图片识别方法, 其特征在于, 所述特征提取模块为预训练
的卷积神经网络, 所述打 分模块为全连接神经网络 。
8.根据权利要求6所述的隐私图片识别方法, 其特征在于, 所述训练方法为: 输入带有
类别标签的多个图片作为训练图片, 从训练图片 中任取一个图片通过特征提取模块得到N
个描述符, 将该图片的所有描述符输入打分模块, 输出N个分数, 将分数作为权重, 对该图片
的所有描述符进行加权平均, 得到该图片的整体特征, 通过图片的整体特征执行图片分类
任务, 当任务内的损失函数收敛时, 训练结束。
9.根据权利要求7所述的隐私图片识别方法, 其特征在于, 从卷积神经网络 中任取一层
的输出作为描述符; 所述特征为(H//S,W//S,C)的张量, 其中H、 W分别 为标准化图片的长和
宽, S和C为 正整数。权 利 要 求 书 1/1 页
2
CN 114898209 A
2一种隐私图片识别方 法
技术领域
[0001]本发明属于图像识别领域, 特别是一种隐私图片识别方法。
背景技术
[0002]数据安全和隐私保护都要求企业清楚的了解自身拥有的隐私/敏感图片, 并保证
这些图片的采集、 存储和流转满足合规要求, 符合安全原则。 然而实际上, 大量图片可能散
布在各个业务系统中, 相关责任人和企业安全负责人很难获悉数据全貌。 因此对业务系统
中的图片进行扫描并识别出隐私图片是必要的。 隐私图片种类庞杂, 如身份证扫描件、 合
同、 增值税发票、 人脸图片、 病例报告等不同类型的图; 并且, 随着业务的发展, 企业可能拥
有的隐私图片种类会改变或者增 加。 因此, 目前缺乏针对隐私图片的识别算法。
发明内容
[0003]本发明是为了解决如何识别隐私图片的问题。
[0004]为了解决上述问题, 本发明提出一种隐私图片识别方法, 是基于图片检索进行隐
私图片分类分级。
[0005]本发明所采用的技 术方案是:
[0006]一种隐私图片识别方法, 包括
[0007]特征提取模块, 所述特征提取模块用于提取标准化后的图片中的特征, 特征经过
L2变换后得到描述符, 每张标准 化后的图片可 得到为N个描述符, N 为正整数;
[0008]隐私特征库, 所述隐私特征库包括标准化后的图片的描述符, 该标准化后的图片
带有类别;
[0009]通过将待测图片经过特征提取模块转换后的描述符与隐私特征库中的描述符进
行匹配, 当两者的距离小于阈值, 则判断为命中, 当命中的数量大于设定值, 将待测图片识
别为与相应 类别的隐私图片。
[0010]作为优选, 还 包括打分模块, 打 分模块用于 筛选进行匹配的描述符。
[0011]作为优选, 所述隐私特征库 中的描述符, 包括预设图片的描述符和自定义图片的
描述符。
[0012]作为优选, 对隐私特征库内同一类图片的描述符进行聚类, 聚类时去除聚类异常
的描述符。
[0013]作为优选, 将待测图片识别为隐私图片后, 对隐私图片进行验证, 如隐私图片和与
其相匹配的图片在几何学上符合透视原理, 则验证通过, 维持识别为隐私图片; 如不符合透
视原理, 则验证不 通过, 取消识别为隐私图片。
[0014]作为优选, 所述筛选方法为: 将待测图片的描述符输入经过图片分类任务训练过
的打分模块, 每个描述符输出一个分数, 按分数从高到低排序, 选取前K 个分数对应的描述
符作为匹配的对象, K为 正整数。
[0015]作为优选, 所述特征提取模块为预训练的卷积神经网络, 所述打分模块为全连接说 明 书 1/3 页
3
CN 114898209 A
3
专利 一种隐私图片识别方法
文档预览
中文文档
6 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:34:29上传分享