(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111662605.3 (22)申请日 2021.12.3 0 (71)申请人 福建亿能达信息技 术股份有限公司 地址 350000 福建省福州市 鼓楼区软件大 道89号福州软件园A区28号楼二层 (72)发明人 黄家昌 应佳良 杨辉 邱道椿  (74)专利代理 机构 福州市鼓楼区京华专利事务 所(普通合伙) 35212 专利代理师 王美花 (51)Int.Cl. G06V 30/40(2022.01) G06V 30/418(2022.01) G06V 30/14(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 10/10(2012.01) G06Q 50/18(2012.01) (54)发明名称 一种合同规范性的审核方法、 装置、 设备和 介质 (57)摘要 本发明提供一种合同规范性的审核 方法、 装 置、 设备和介质, 方法包括: 接收到合同审核指 令, 获取合同文件的格式信息; 根据所述格式信 息判断是否可按照相应的编码格式直接获取文 字信息, 若是, 则直接读取文档内容, 若否, 则调 用光学字符识别模型获取文档内容, 形成全文内 容文本; 将所述全文内容文本与合同类型模板进 行正交比对, 确认合同所属的种类, 并根据种类 确认适用的审核模板; 调用适用的审核模板, 对 所述全文内容文本进行模板比对审核。 本发明可 以通过不同的合同文件格式来综合匹配不同的 方式以获取合同文件的内容文本并进行审核, 而 且既能小体量的光学字 符识别模 型, 从而提升模 型的识别速度, 又能保证模型的识别效果。 权利要求书3页 说明书8页 附图2页 CN 114511854 A 2022.05.17 CN 114511854 A 1.一种合同规范性的审核方法, 其特 征在于: 包括下述 步骤: S1、 接收到合同审核指令, 获取合同文件的格式信息; S2、 根据所述格 式信息判断是否可按照相应的编码格 式直接获取文字信息, 若是, 则直 接读取文档内容, 若否, 则调用光学字符识别模型获取文档内容, 形成全文内容文本; S3、 将所述全文内容文本与合同类型模板进行正交比对, 确认合同所属的种类, 并根据 种类确认适用的审核模板, 所述审核模板包括一个或多个关键词、 各关键词使用的空间条 件以及各关键词的叙述 规范; S4、 调用适用的审核模板, 对所述全文内容文本进行模板比对审核, 具体是: 将所述全 文内容文本与各 所述关键词进行一 一比对, 判断是否存在所述关键词; 若否, 则提 示需添加相关项; 若是, 进一步判断关键词是否满足所述空间条件, 若不满足, 则提示对于该审核项需要 清晰说明; 若满足, 则给出该合同涉及相关项且不违规的提示, 并根据所述叙述规范进一步 判断关键词叙述是否规范; 若不规范, 则直接提示不规范并显示规范要求; 若规范, 则提示 合同符合 规范。 2.根据权利要求1所述的一种合同规范性的审核方法, 其特征在于: 所述光学字符识别 模型为经过扫描合同数据集 强化训练好的智能模型, 所述光学字符识别模 型获取文档内容 的具体过程如下: (1)、 通过 预处理模型对合同文件进行 预处理后并得到合同文件的预处 理图片; (2)、 将预处理图片输入到空间模型中, 通过卷积、 池化、 激活函数提取空间潜层信息; 所述空间模 型在融合浅层信息和融合深层信息特征时, 均是采用一层1*1卷积层和一层3*3 或5*5的卷积层; (3)、 将得到的空间潜层信息输入到时序模型中, 通过多层双向SRN层提取时序潜层信 息; (4)、 根据时序潜层信息对输入的图片进行字符分类, 得到全文内容文本 。 3.根据权利要求2所述的一种合同规范性的审核方法, 其特征在于: 所述空间模型的构 成如下: 第一层是卷积层, 卷积核为5 ×5, 步长为2 ×2, 填充为2 ×2, 通道数为24, 激活函数为 ReLU; 第二层是卷积层, 卷积核为3 ×3, 步长为1 ×1, 填充为1 ×1, 通道数为24, 激活函数为 ReLU; 第三层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为128; 第四层是池化层, 核为2, 步长为2; 第五层是卷积层, 卷积核为3 ×3, 步长为1 ×1, 填充为1 ×1, 通道数为128, 归一化方法 为BN, 激活函数为ReLU; 第六层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为25 6, 归一化方法为BN; 第七层是卷积层, 卷积核为3 ×3或5×5, 步长为1 ×1, 填充为1 ×1, 通道数为256, 归一 化方法为BN, 激活函数为ReLU; 第八层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为25 6; 第九层是池化层, 核为2 ×2, 步长为2 ×1, 填充为0 ×1;权 利 要 求 书 1/3 页 2 CN 114511854 A 2第十层是卷积层, 卷积核为3 ×3, 步长为1 ×1, 填充为1 ×1, 通道数为256, 归一化方法 为BN, 激活函数为ReLU; 第十一层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为512, 归一 化方法为BN; 第十二层是卷积层, 卷积核为3 ×3或5×5, 步长为1 ×1, 填充为1 ×1, 通道数为512, 激 活函数为ReLU; 第十三层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为512; 第十四层是池化层, 核为2 ×2, 步长为2 ×1, 填充为0 ×1; 第十五层是卷积层, 卷积核为2 ×2, 步长为1 ×1, 填充为1 ×1, 通道数为512, 归一化方 法为BN, 激活函数为ReLU; 第十六层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为512, 归一 化方法为BN。 4.根据权利要求1所述的一种合同规范性的审核方法, 其特征在于: 所述 时序模型的构 成是: 第一层为双向SRN层, 节点数为25 6; 第二层为全连接层, 节点数为25 6: 第三层为双向SRN层, 节点数为25 6: 第四层为全连接层, 节点数为25 6。 5.一种合同规范性的审核装置, 其特 征在于: 包括: 格式判断模块, 用于在接收到合同审核指令后, 获取合同文件的格式信息; 文档内容获取模块, 用于根据 所述格式信 息判断是否可按照相应的编码格式直接获取 文字信息, 若 是, 则直接读取文档内容, 若否, 则调用光学字符识别模 型获取文档内容, 形成 全文内容文本; 审核规则确认模块, 用于将所述全文内容文本与合同类型模板进行正交比对, 确认合 同所属的种类, 并根据种类确认适用的审核模板, 所述审核模板包括一个或多个关键词、 各 关键词使用的空间条件以及各关键词的叙述 规范; 审核模块, 用于调用适用的审核模板, 对所述全文内容文本进行模板比对审核, 具体 是: 将所述全文内容文本与各 所述关键词进行一 一比对, 判断是否存在所述关键词; 若否, 则提 示需添加相关项; 若是, 进一步判断关键词是否满足所述空间条件, 若不满足, 则提示对于该审核项需要 清晰说明; 若满足, 则给出该合同涉及相关项且不违规的提示, 并根据所述叙述规范进一步 判断关键词叙述是否规范; 若不规范, 则直接提示不规范并显示规范要求; 若规范, 则提示 合同符合 规范。 6.根据权利要求5所述的一种合同规范性的审核装置, 其特征在于: 所述光学字符识别 模型为经 过扫描合同数据集强化训练好的智能模型, 具体包括: 预处理模型, 用于对合同文件进行 预处理后并得到合同文件的预处 理图片; 空间模型, 用于将预处理图片通过卷积、 池化、 激活函数提取空间潜层信息; 所述空间 模型在融合浅层信息和融合深层信息特征时, 均是采用一层1*1卷积层和一层3*3或5*5的 卷积层; 时序模型, 用于将得到的空间潜层信息通过多层 双向SRN层提取时序潜层信息; 嵌入层, 用于根据时序潜层信息对输入的图片进行字符分类, 得到全文内容文本 。权 利 要 求 书 2/3 页 3 CN 114511854 A 3

.PDF文档 专利 一种合同规范性的审核方法、装置、设备和介质

安全报告 > 其他 > 文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种合同规范性的审核方法、装置、设备和介质 第 1 页 专利 一种合同规范性的审核方法、装置、设备和介质 第 2 页 专利 一种合同规范性的审核方法、装置、设备和介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-18 20:06:31上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。