全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210188546.9 (22)申请日 2022.02.28 (71)申请人 太极计算机股份有限公司 地址 100020 北京市朝阳区容达路7号中电 太极信息产业园 (72)发明人 张晓芳 欧睿 饶攀军 郑元  张雷 陈科 王浩畅 周郴莲  郑冠彧 赵铁军  (74)专利代理 机构 哈尔滨市阳光惠远知识产权 代理有限公司 2321 1 专利代理师 邓宇 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 16/33(2019.01)G06F 40/289(2020.01) G06F 40/284(2020.01) G06F 40/295(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 5/02(2006.01) (54)发明名称 一种基于深度学习和知识图谱的合同审查 方法、 装置、 设备和存 储介质 (57)摘要 本发明公开了一种基于深度学习和知识图 谱的合同审查方法、 装置、 设备和存储介质, 属于 合同审查技术领域, 解决合同审查的工作效率、 准确率以及合理性都很低的问题。 本发明的方法 包括: 对待审合同进行分类; 根据所述待审合同 的分类, 选取要素抽取模型, 所述要素抽取模型 是基于深度学习建立得到; 利用所述要素抽取模 型, 对所述待审合同的要素和条款进行抽取, 获 取待审要素和待审条款, 所述待审要素包括要素 内容和要素类型, 所述待审条款包括条款内容和 条款类型; 根据所述待审要素和待审条款, 检索 合同知识图谱, 获取对应的检索条款; 基于所述 对应的检索条款, 对所述待审条款进行审核。 本 发明适用于对合同或 公文的审查。 权利要求书2页 说明书11页 附图7页 CN 114661914 A 2022.06.24 CN 114661914 A 1.一种基于深度学习和知识图谱的合同审查方法, 其特 征在于, 所述方法包括: 步骤1、 对待审合同进行分类, 所述分类具体包括: 步骤1.1、 根据所述待审合同的标题, 对所述待审合同进行分类, 若获取到所述待审合 同的分类, 执 行步骤2; 否则, 执行步骤1.2; 步骤1.2、 根据所述待审合同的文本, 对所述待审合同进行分类, 获取所述待审合同的 分类, 执行步骤2; 步骤2、 根据所述待审合同的分类, 选取要素抽取模型, 所述要素抽取模型是基于深度 学习建立得到; 步骤3、 利用所述要素抽取模型, 对所述待审合同的要素和条款进行抽取, 获取待审要 素和待审条款, 所述待审要素包括要素内容和要素类型, 所述待审条款包括条款内容和条 款类型; 步骤4、 根据所述待审要素和待审条款, 检索合同知识图谱, 获取对应的检索条款; 步骤5、 基于所述对应的检索条款, 对所述待审条款进行审核。 2.根据权利要求1所述的一种基于深度 学习和知识图谱的合同审查方法, 其特征在于, 步骤1.1中所述的, 根据所述待审合同的标题, 对所述待审合同进行分类, 具体包括: 采用词向量表示待审合同的标题文本; 根据所述词向量, 利用Bi LSTM模型获取 所述待审合同的标题文本特 征; 根据所述待审合同的标题文本特征, 利用Attention注意力机制, 获取所述待审合同的 标题文本特 征的重要程度; 将所述待审合同的标题文本特征的重要程度进行池化后, 利用分类器对所述待审合同 进行分类。 3.根据权利要求1所述的一种基于深度 学习和知识图谱的合同审查方法, 其特征在于, 步骤1.2中所述的, 对 所述待审合同进行分类, 具体采用HAN模型对 所述待审合同进行分类, 所述HAN模型由词序列编码器、 词级attention层、 句子序列编码器和句子级attention层组 成。 4.根据权利要求1所述的一种基于深度 学习和知识图谱的合同审查方法, 其特征在于, 步骤2中所述的要素抽取模型 是基于深度学习建立得到, 具体包括: 所述要素抽取模型包括输入特 征层、 BiLSTM中间层和CRF输出层; 所述输入特征层将输入合同的文本按字符进行分割, 将每个字使用拼接的特征向量进 行表示, 获取文本序列; 所述BiLSTM中间层利用LSTM神经网络层对所述文本序列进行建模, 所述LSTM神经网络 层包含前向和后向两个方向; 所述CRF输出层利用CRF层作为所述要素抽 取模型的输出层, 生成对应的 “BIO”格式的 标签序列。 5.根据权利要求1所述的一种基于深度 学习和知识图谱的合同审查方法, 其特征在于, 所述步骤4中, 所述 合同知识图谱的是通过 下述方法建立的, 所述方法具体包括: 步骤4.1、 构建合同知识图谱的本体; 步骤4.2、 根据所述合同知识图谱的本体, 利用BILSTM ‑CRF结构的模型, 获取合 同文本权 利 要 求 书 1/2 页 2 CN 114661914 A 2中的实体以及实体之间的关系, 根据所述合同文本中的实体以及实体之间的关系, 获取合 同知识图谱的实体三元组; 步骤4.3、 对所述 合同文本中的实体以及实体之间的关系进行异构数据的融合; 步骤4.4、 根据 所述融合后的合同文本中的实体以及实体之间的关系, 获取合同知识图 谱的三元组, 基于图结构的存 储方式对所述 合同知识图谱的三元组进行存 储; 步骤4.5、 根据所述 合同知识图谱的三元组, 构建合同知识图谱。 6.根据权利要求5所述的一种基于深度 学习和知识图谱的合同审查方法, 其特征在于, 步骤4.1中所述的, 构建合同知识图谱的本体, 具体包括: 定义合同的分类、 要素、 属性、 关系和约束, 根据所述合同的分类、 要素、 属性、 关系和约 束构建合同知识图谱的本体。 7.根据权利要求5所述的一种基于深度 学习和知识图谱的合同审查方法, 其特征在于, 所述步骤4.4之后, 还包括: 基于不完备知识库的关联规则挖掘算法, 对所述合同知识图谱 的三元组进行补充; 然后执 行步骤4.5 。 8.一种基于深度学习和知识图谱的合同审查装置, 其特征在于, 所述装置包括合同分 类模块、 要素抽取模型选取模块、 要素 条款抽取模块、 检索条款获取模块和审核模块; 所述合同分类模块, 用于对待审合同进行分类, 所述合同分类模块包括标题分类模块 和文本分类模块: 所述标题分类模块, 用于根据 所述待审合同的标题, 对所述待审合同进行分类, 若获取 到所述待审合同的分类, 执 行所述要素抽取模型选取模块; 否则, 执行所述文本分类模块; 所述文本分类模块, 用于根据 所述待审合同的文本, 对所述待审合同进行分类, 获取所 述待审合同的分类, 执 行所述要素抽取模型选取模块; 所述要素抽取模型选取模块, 用于根据 所述待审合同的分类, 选取要素抽取模型, 所述 要素抽取模型 是基于深度学习建立得到; 所述要素条款抽取模块, 用于利用所述要素抽取模型, 对所述待审合同的要素和条款 进行抽取, 获取待审要 素和待审条款, 所述待审要 素包括要 素内容和要 素类型, 所述待审条 款包括条款内容和条款类型; 所述检索条款获取模块, 用于根据所述待审要素和待审条款, 检索合同知识图谱, 获取 对应的检索条款; 所述审核模块, 用于基于所述对应的检索条款, 对所述待审条款进行审核。 9.一种计算机设备, 包括存储器和处理器, 所述存储器中存储有计算机程序, 其特征在 于, 当所述处理器运行所述存储器存储的计算机程序时执行权利要求 1至7中任一项 所述的 方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114661914 A 3

.PDF文档 专利 一种基于深度学习和知识图谱的合同审查方法、装置、设备和存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于深度学习和知识图谱的合同审查方法、装置、设备和存储介质 第 1 页 专利 一种基于深度学习和知识图谱的合同审查方法、装置、设备和存储介质 第 2 页 专利 一种基于深度学习和知识图谱的合同审查方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。