(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210593966.5
(22)申请日 2022.05.27
(71)申请人 平安银行股份有限公司
地址 518000 广东省深圳市罗湖区深南 东
路5047号
(72)发明人 王夏
(74)专利代理 机构 深圳市赛恩倍吉知识产权代
理有限公司 4 4334
专利代理师 陈海云 严林
(51)Int.Cl.
G06F 40/226(2020.01)
G06F 40/30(2020.01)
G06N 3/08(2006.01)
(54)发明名称
文件合规性检查方法、 装置、 电子设备及存
储介质
(57)摘要
本发明涉及人工智能技术领域, 提供一种文
件合规性检查方法、 装置、 电子设备及存储介质,
所述方法包括: 获取待检查的合规文件; 对待检
查的合规文件进行第一预处理, 获取合规类型;
基于合规类型, 获取原始合规文件样本集; 对原
始合规文件样本集进行第二预处理, 得到标准合
规文件样本集; 创建合规检查模型, 将标准合规
文件样本集和待检查的合规文件输入至合规检
查模型中, 得到合规检查结果, 其中, 合规检查模
型中包含有语义模型和合规组件模 型。 本发明将
标准合规文件与语义模型输出的标准化合规规
则进行重新组合加以训练合规组件模 型, 使得训
练得到的合规组件模型更加的精确, 进而提高了
合规检查结果的准确率。
权利要求书2页 说明书13页 附图2页
CN 114925674 A
2022.08.19
CN 114925674 A
1.一种文件合 规性检查方法, 其特 征在于, 所述方法包括:
解析接收的文件合 规性检查请求, 获取待检查的合 规文件;
对所述待检查的合规文件进行第 一预处理, 获取所述待检查的合规文件对应的合规类
型;
基于所述待检查的合 规文件对应的合 规类型, 获取原 始合规文件样本集;
对所述原 始合规文件样本集进行第二预处 理, 得到标准 合规文件样本集;
创建合规检查模型, 将所述标准合规文件样本集和所述待检查的合规文件输入至所述
合规检查模型中, 得到所述待检查的合规文件的合规检查结果, 其中, 所述合规检查模型中
包含有语义模型和合 规组件模型。
2.如权利要求1所述的文件合规性检查方法, 其特征在于, 所述对所述待检查的合规文
件进行第一预处 理, 获取所述待检查的合 规文件对应的合 规类型包括:
识别所述待检查的合 规文件的标签;
将识别到的标签输入至预先训练好的合规类型分类模型中, 得到所述待检查的合规文
件对应的合 规类型。
3.如权利要求1所述的文件合规性检查方法, 其特征在于, 所述基于所述待检查的合规
文件对应的合 规类型, 获取原 始合规文件样本集包括:
从预设的源数据库中获取与所述待检查的合 规文件的合 规类型对应的目标 数据源;
采用爬虫技 术从所述目标 数据源中, 按照预设的规则获取原 始合规文件样本集。
4.如权利要求1所述的文件合规性检查方法, 其特征在于, 所述对所述原始合规文件样
本集进行第二预处 理, 得到标准 合规文件样本集包括:
根据所述待检查的合 规文件对应的合 规类型, 获取对应的标准定义的数据结构;
按照所述数据结构将所述原始合规文件样本集中的每个原始合规文件样本进行数据
转换, 得到标准 合规文件样本集。
5.如权利要求1所述的文件合规性检查方法, 其特征在于, 所述将所述标准合规文件样
本集和所述待检查的合规文件输入至所述合规检查模型中, 得到所述待检查的合规文件的
合规检查结果包括:
将所述标准 合规文件样本集输入至所述语义模型中, 得到标准 化合规规则;
将所述标准化合规规则和所述待检查的合规文件输入至与所述语义模型连接的合规
组件模型中, 得到所述待检查的合 规文件的合 规检查结果。
6.如权利要求5所述的文件合规性检查方法, 其特征在于, 所述语义模型的训练过程包
括:
获取所述合规类型对应的多个历史标准合规文件及每个所述历史标准合规文件的标
准化合规规则集;
从预设的语义表中查找每个所述历史标准合规文件的标准化合规规则中的每个标准
化合规规则对应的语义向量, 构建每 个所述历史标准 合规文件的语义矩阵;
将所述多个历史标准 合规文件的多个 语义矩阵确定为语义样本集;
将所述语义样本集按照预设的比例划分为训练集和 测试集;
将所述训练集输入至预设神经网络中进行训练, 得到语义模型;
将所述测试集输入至所述语义模型中进行测试, 并计算测试通过率;权 利 要 求 书 1/2 页
2
CN 114925674 A
2若所述测试通过率大于或者等于预设通过率阈值, 确定所述语义模型训练结束; 若所
述测试通过率小于所述预设通过率阈值, 增 加训练集的数量, 重新进行语义模型的训练。
7.如权利要求5所述的文件合规性检查方法, 其特征在于, 所述将所述标准化合规规则
和所述待检查的合规文件输入至与所述语义模 型连接的合规组件模型中, 得到所述待检查
的合规文件的合 规检查结果包括:
按照所述合规类型对应的标准定义的数据结构对所述待检查的合规文件进行数据转
换, 得到待检查的标准 合规文件;
将所述待检查的标准合规文件和所述标准化合规规则输入至与所述语义模型连接的
合规组件模型中, 得到所述待检查的合 规文件的合 规检查结果。
8.一种文件合 规性检查装置, 其特 征在于, 所述装置包括:
解析和获取模块, 用于解析接收的文件合 规性检查请求, 获取待检查的合 规文件;
第一预处理模块, 用于对所述待检查的合规文件进行第一预处理, 获取所述待检查的
合规文件对应的合 规类型;
获取模块, 用于基于所述待检查的合规文件对应的合规类型, 获取原始合规文件样本
集;
第二预处理模块, 用于对所述原始合规文件样本集进行第二预处理, 得到标准合规文
件样本集;
创建和输入模块, 用于创建合规检查模型, 将所述标准合规文件样本集和所述待检查
的合规文件输入至所述合规检查模型中, 得到所述待检查的合规文件的合规检查结果, 其
中, 所述合规检查模型中包 含有语义模型和合 规组件模型。
9.一种电子设备, 其特征在于, 所述电子设备包括处理器和存储器, 所述处理器用于执
行所述存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述的文件合规性
检查方法。
10.一种计算机可读存储介质, 所述计算机可读存储介质上存储有计算机程序, 其特征
在于, 所述计算机程序被处理器执行时实现如权利要求 1至7中任意一项 所述的文件合规性
检查方法。权 利 要 求 书 2/2 页
3
CN 114925674 A
3
专利 文件合规性检查方法、装置、电子设备及存储介质
安全报告 >
其他 >
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:13:10上传分享