(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210561843.3
(22)申请日 2022.05.23
(71)申请人 北京北信源软件股份有限公司
地址 100081 北京市海淀区中关村南大街
34号中关村科技发展大厦C座16 02室
(72)发明人 林皓 田红峰 杨泳 王君
(74)专利代理 机构 北京友谊嘉知识产权代理事
务所(普通 合伙) 16075
专利代理师 刘亭
(51)Int.Cl.
G06F 21/78(2013.01)
G06F 21/62(2013.01)
(54)发明名称
敏感信息处理方法、 装置、 电子设备及存储
介质
(57)摘要
本公开实施例公开了一种敏感信息处理方
法、 装置、 电子设备及存储介质。 其中, 敏感信息
处理方法, 包括: 扫描文件 得到文本数据; 基于预
配置的关键字对 所述文本数据进行查询, 得到所
述文本数据中匹配的关键字及该敏感文本的存
储路径, 所述敏感文本为匹配到关键字的文本;
判断所述敏感文本的类型, 并根据所述类型对所
述敏感文本进行结构解析, 得到解析数据; 根据
预配置的敏感信息处理规则对解析数据中的关
键字进行处理。 不用对包含 敏感信息的整个文件
加密, 而只是对敏感信息的关键字进行处理, 避
免了对整个文件的修改, 从而达到避免文件损坏
的目的。
权利要求书2页 说明书8页 附图2页
CN 114969852 A
2022.08.30
CN 114969852 A
1.一种敏感信息处 理方法, 其特 征在于, 包括:
扫描文件得到文本数据;
基于预配置的关键字对所述文本数据进行查询, 得到所述文本数据中匹配的关键字及
该敏感文本的存 储路径, 所述敏感文本为匹配到关键 字的文本;
判断所述敏感文本的类型, 并根据所述类型对所述敏感文本进行结构解析, 得到解析
数据;
根据预配置的敏感信息处 理规则对解析 数据中的关键 字进行处 理。
2.根据权利要求1所述的敏感信息处理方法, 其特征在于, 所述扫描文件得到文本数
据, 包括:
对文件进行 预处理, 得到所述文件中的文本数据。
3.根据权利要求1或2所述的敏感信息处理方法, 其特征在于, 所述扫描文件得到文本
数据, 包括:
查询扫描设备的剩余资源;
基于所述剩余资源开启相应数量用于扫描 文件的线程。
4.根据权利要求3所述的敏感信 息处理方法, 其特征在于, 所述基于所述剩余资源开启
相应数量用于扫描 文件的线程, 包括:
判断所述剩余资源与总资源的占比, 当所述占比每达 到设定比例时, 开启一个线程;
当所述占比达 到设定阈值时, 停止为扫描 文件开启新线程, 并发送提 示信息。
5.根据权利要求1所述的敏感信 息处理方法, 其特征在于, 所述预配置的敏感信 息处理
规则, 包括标注规则、 涂改规则和恢复规则。
6.根据权利要求5所述的敏感信息处 理方法, 其特 征在于, 所述涂改规则, 包括:
将涂改前的信息保存到扩展字段中。
7.根据权利要求6所述的敏感信息处 理方法, 其特 征在于, 所述恢复规则包括:
自动恢复规则、 标注恢复规则、 涂改恢复规则和/或 从扩展字段恢复规则;
所述自动恢复规则, 包括用户身份验证, 所述身份验证包括以下步骤:
接收用户发送 的认证数据, 基于用户名在预配置的文件中查找用户对应的密码, 预配
置的文件中存 储密码、 消息验证码和序列号;
基于所述密码对认证数据进行解密得到第一消息验证码;
基于用户名在预配置的文件查找消息验证码, 得到与该用户对应的第二消息验证码,
对比第一消息验证码和第二消息验证码是否相同;
当第一消息验证码和第二消息验证码相同时, 该用户通过身份认证, 并将预配置的文
件中的序列号加1, 得到更新序列号;
基于更新序列号对预配置的文件中消息验证码进行计算得到更新消息验证码;
将所述预配置的文件中存 储的消息验证码使用密码和更新消息验证码替换。
8.一种敏感信息处 理装置, 其特 征在于, 包括:
文档扫描模块, 用于扫描 文件得到文本数据;
匹配模块, 用于基于预配置的关键字对所述文本数据进行查询, 得到所述文本数据中
匹配的关键 字及该敏感文本的存 储路径, 所述敏感文本为匹配到关键 字的文本;
结构解析模块, 用于判断所述敏感文本的类型, 并根据所述类型对所述敏感文本进行权 利 要 求 书 1/2 页
2
CN 114969852 A
2结构解析, 得到解析 数据;
敏感信息处理模块, 用于根据 预配置的敏感信 息处理规则对解析数据中的关键字进行
处理。
9.一种电子设备, 其特 征在于, 所述电子设备包括:
至少一个处 理器; 以及,
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处
理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑7任一所述的敏感信息处 理方法。
10.一种计算机可读存储介质, 其特征在于, 该计算机可读存储介质存储计算机指令,
该计算机指令用于使计算机执 行权利要求1 ‑7任一所述的敏感信息处 理方法。权 利 要 求 书 2/2 页
3
CN 114969852 A
3
专利 敏感信息处理方法、装置、电子设备及存储介质
安全报告 >
其他 >
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-07 20:39:05上传分享