(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210733006.4
(22)申请日 2022.06.27
(71)申请人 平安银行股份有限公司
地址 518000 广东省深圳市罗湖区深南 东
路5047号
(72)发明人 高健
(74)专利代理 机构 深圳紫藤知识产权代理有限
公司 44570
专利代理师 熊恒定
(51)Int.Cl.
G06F 16/9032(2019.01)
G06F 16/903(2019.01)
G06F 21/62(2013.01)
(54)发明名称
敏感字符串检索方法、 装置、 电子设备及存
储介质
(57)摘要
本申请实施例提供了一种敏感字符串检索
方法、 装置、 电子设备及存储介质。 该方法首先接
收用户针对目标文件的敏感词检索请求, 根据敏
感词检索请求中携带的原始待检索敏感词字符
串和应用场景类型信息中的至少一种, 确定多个
目标待检索敏感词字符串, 再将多个目标待检索
敏感词字符串的敏感词信息分别与 目标文件的
字符串信息进行匹配, 从目标文件的字符串信息
中检索出与 目标待检索敏感词字符串相 匹配的
标的敏感字符串。 本申请根据待检索敏感词字 符
串和应用场景类型信息中的至少一种, 一次性确
定多个目标待检索敏感词字 符串, 再基于目标待
检索敏感词字符串, 对目标文件的字符串进行敏
感词检索, 提高了敏感词检索效率。
权利要求书2页 说明书8页 附图3页
CN 115080810 A
2022.09.20
CN 115080810 A
1.一种敏感字符串检索方法, 其特 征在于, 包括:
接收用户针对目标文件的敏感词检索请求, 所述敏感词检索请求携带原始待检索敏感
词字符串和应用场景类型信息中的至少一种;
根据所述原始待检索敏感词字符串和应用场景类型信 息中的至少一种, 确定多个目标
待检索敏感词字符串;
获取多个目标待检索敏感词字符串分别对应的敏感词信 息, 所述敏感词信 息包括敏感
词字符串格式信息、 敏感词字符串长度信息;
将所述多个目标待检索敏感词字符串的敏感词字符串格式信 息、 敏感词字符串长度信
息分别与所述目标文件的字符串信息进行匹配, 从所述目标文件的字符串信息中检索出与
所述目标待检索敏感词字符串相匹配的标的敏感字符串。
2.如权利要求1所述的敏感字符串检索方法, 其特征在于, 所述敏感词检索请求携带原
始待检索敏感词字符串和应用场景类型信息; 所述根据所述原始待检索敏感词字符串和应
用场景类型信息中的至少一种, 确定多个目标待检索敏感词字符串, 包括:
根据所述原始待检索敏感词字符串, 确定与所述原始待检索敏感词字符串相关联的多
个关联敏感词字符串;
根据所述应用场景类型信 息, 从所述多个关联敏感词字符串中确定所述多个目标待检
索敏感词字符串。
3.如权利要求2所述的敏感字符串检索方法, 其特征在于, 所述根据所述原始待检索敏
感词字符串, 确定与所述原 始待检索敏感词字符串相关联的多个关联 敏感词字符串, 包括:
将所述原始待检索敏感词字符串输入到训练好的关联词匹配模型中进行匹配, 得到所
述多个关联 敏感词字符串。
4.如权利要求1所述的敏感字符串检索方法, 其特征在于, 所述将所述多个目标待检索
敏感词字符串的敏感词字符串格式信息、 敏感词字符串长度信息分别与所述目标文件的字
符串信息进行匹配, 从所述目标文件的字符串信息中检索出与所述目标待检索敏感词字符
串相匹配的标的敏感字符串, 包括:
将所述多个目标待检索敏感词字符串的敏感词字符串格式分别与所述目标文件的字
符串格式进行匹配, 从所述目标文件的字符串筛 选出多个候选敏感字符串;
将所述多个目标待检索敏感词字符串的敏感词字符串长度分别与所述多个候选敏感
字符串长度进行比较, 从所述多个候选敏感字符串确定所述标的敏感字符串。
5.如权利要求4所述的敏感字符串检索方法, 其特征在于, 所述将所述多个目标待检索
敏感词字符串的敏感词字符串长度分别与所述多个候选敏感字符串长度进 行比较, 从所述
多个候选敏感字符串确定所述标的敏感字符串, 包括:
根据所述多个目标待检索敏感词字符串的敏感词字符串长度分别与所述多个候选敏
感字符串长度, 分别确定所述目标待检索敏感词字符串长度与所述多个候选敏感字符串长
度之差的绝对值;
将所述绝对绝小于预设阈值的候选敏感字符串, 确定为所述标的敏感字符串。
6.如权利要求1所述的敏感字符串检索方法, 其特征在于, 所述获取多个目标待检索敏
感词字符串分别对应的敏感词信息, 包括:
根据所述多个目标待检索敏感词字符串, 确定所述多个目标待检索敏感词字符串分别权 利 要 求 书 1/2 页
2
CN 115080810 A
2对应的敏感词字符串格式信息;
根据所述多个目标待检索敏感词字符串分别对应的敏感词字符串格式信 息, 确定所述
多个目标待检索敏感词字符串分别对应的敏感词字符串长度信息 。
7.如权利要求1所述的敏感字符串检索方法, 其特征在于, 所述将所述多个目标待检索
敏感词字符串的敏感词字符串格式信息、 敏感词字符串长度信息分别与所述目标文件的字
符串信息进行匹配, 从所述目标文件的字符串信息中检索出与所述目标待检索敏感词字符
串相匹配的标的敏感字符串之后, 还 包括:
对所述目标 敏感字符串 进行脱敏处 理。
8.一种敏感字符串检索装置, 其特 征在于, 包括:
接收模块, 用于接收用户针对目标文件的敏感词检索请求, 所述敏感词检索请求携带
原始待检索敏感词字符串和应用场景类型信息中的至少一种;
确定模块, 用于根据所述原始待检索敏感词字符串和应用场景类型信息中的至少一
种, 确定多个目标待检索敏感词字符串;
获取模块, 用于获取多个目标待检索敏感词字符串分别对应的敏感词信息, 所述敏感
词信息包括敏感词字符串格式信息、 敏感词字符串长度信息;
匹配模块, 用于将所述多个目标待检索敏感词字符串的敏感词字符串格式信息、 敏感
词字符串长度信息 分别与所述目标文件的字符串信息进行匹配, 从所述目标文件的字符串
信息中检索出与所述目标待检索敏感词字符串相匹配的标的敏感字符串。
9.一种电子设备, 其特征在于, 所述电子设备包括存储器、 处理器以及存储在所述存储
器上并可在所述处理器上运行的计算机程序, 所述处理器执行所述计算机程序时实现如权
利要求1至7任一项所述的敏感字符串检索方法中的步骤。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程
序, 所述计算机程序被处理器执行时实现如权利要求 1至7任一项 所述的敏感字符串检索方
法的步骤。权 利 要 求 书 2/2 页
3
CN 115080810 A
3
专利 敏感字符串检索方法、装置、电子设备及存储介质
安全报告 >
其他 >
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-07 20:38:31上传分享