全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111551351.8 (22)申请日 2021.12.17 (71)申请人 上海迅猎科技有限公司 地址 201306 上海市浦东 新区环湖西二路 888号C楼 (72)发明人 于峰 于军英  (51)Int.Cl. G06F 40/30(2020.01) G06F 40/186(2020.01) G06F 40/253(2020.01) G06K 9/62(2022.01) G06Q 10/10(2012.01) G06Q 50/18(2012.01) (54)发明名称 基于要素抽取的合同评审方法、 设备及存储 介质 (57)摘要 本发明公开了基于要素抽取的合同评审方 法及设备, 涉及数据处理技术领域。 所述方法包 括: 对输入的待评审合同文档集进行预处理, 建 立各合同的标题索引链; 将各合同的标题索引链 与预设分类的合同模板进行比对, 将合同划分为 标准类合同组和个性化合同组; 对于标准类合同 组的合同, 依据合同所匹配的合同模板的要素抽 取规则进行合同要素抽取; 对于个性化合同组的 合同, 根据用户通过要素标注工具对个性化合同 设置的要素标注信息和要素抽取规则信息对个 性化合同进行合同要素抽取; 根据抽取的合同要 素生成要素化结构合同并发送到评审终端输出。 本发明提高了个性化合同的要素抽取精确率和 准确性, 提高了用于评审的要素化结构合同文档 的准确性。 权利要求书2页 说明书9页 附图3页 CN 114118098 A 2022.03.01 CN 114118098 A 1.一种基于要素抽取的合同评审方法, 其特 征在于包括 步骤: 对输入的待评审合同文档集进行预处理, 其中, 对待评审合同文档集中的每个合同进 行文档解析以获取各合同的文档目录信息, 根据文档目录中的标题等级信息建立各合同的 标题索引链; 将各合同的标题索引链与 预设分类的合同模板的标题索引链进行比对, 将标题索引链 的标题等级关系能够完全匹配前述合同模板中的任一类的合同划分为标准类合同组, 将标 题索引链的层级关系无法单一匹配前述合同模板中的任一类的合同划分为个性化合同组; 对应每类合同模板预设有 要素抽取规则; 对于标准类合同组中的每个标准合同, 依据 该标准合同所匹配的合同模板的要素抽取 规则进行合同要素抽取; 对于个性化合同组中的个性化合同, 获取用户通过要素标注工具 对个性化合同设置的要素标注信息和要素抽取规则信息, 根据前述要 素标注信息和要 素抽 取规则信息对个性 化合同进行合同要素抽取; 根据抽取的合同要素生成各合同的要素化结构合同, 将各合同的要素化结构合同发送 到评审终端输出以供用户评审。 2.根据权利要求1所述的合同评审方法, 其特征在于: 所述标准类合同组中的每个标准 合同的所属分类即为其匹配的合同模板的合同类型, 在将标准合同的要 素化结构合同发送 到评审终端时, 依据该标准合同的合同类型分批发送, 属于同一类型 的标准合同同批次发 送至评审终端, 并在评审终端对应着标准 合同输出其所属的合同类型。 3.根据权利要求1所述的合同评审方法, 其特征在于: 对于个性化合同组中的合同进行 合同要素抽取的步骤如下, 对于个性化合同组中的所有个性化合同, 根据各个性化合同的标题索引链进行二 次分 组, 将标题索引链的相似度超过 预设相似度阈值的合同划分为同一小组; 对于个性化合同组中的每一合同小组, 从每个合同小组中选择一个合同作为样本合 同; 获取用户通过要素标注工具对前述样本合同设置的要素标注信 息和要素抽取规则, 根 据前述要素标注信息和要素抽取规则抽取样本合同的关键要素并形成该样本合同的个性 化要素抽取规则, 将该个性化要 素抽取规则作为该样本合同所属合同小组的个性化要 素抽 取规则; 个性 化合同组中不同小组的合同对应不同的个性 化要素抽取规则; 对于每个合同小组中的其它合同, 根据合同所属的合同小组获取对应的个性化要素抽 取规则后, 按照个性 化要素抽取规则进行合同要素抽取。 4.根据权利要求3所述的合同评审方法, 其特征在于: 对于个性化合同组中的每个合同 小组, 根据每个合同小组中的样本合同的标题索引链与前述合同模板的标题索引链的比对 信息, 基于标题索引链的部分匹配方式获取每个样本合同包含的合同类型, 每个合同至少 对应两个合同类型。 5.根据权利要求4所述的合同评审方法, 其特征在于: 基于标题索引链的部分匹配方式 获取样本合同包 含的合同类型的步骤如下: 获取该样本合同的标题索引链信 息, 将标题索引链信 息分别与 前述合同模板中的每类 合同模板的标题索引链进行比对, 获取 该样本合同与各类合同模板的部分匹配信息; 根据前述部分匹配信息, 按照前述样本合同的文档章节顺序对标题索引链进行拆解,权 利 要 求 书 1/2 页 2 CN 114118098 A 2使得拆解后的每段标题索引链都能够匹配一个合同模板的标题索引链, 且相 邻段标题索引 链之间无章节重复内容; 获取拆解后的多个标题索引链段对应的多个合同模板, 建立前述样本合同与 前述多个 合同模板的合同类型对应关系。 6.根据权利要求5所述的方法, 其特征在于: 根据样本合同包含的多个合同类型, 根据 每类合同预设的要素抽取规则形成该样本合同的第二个性 化要素抽取规则; 根据前述第 二个性化要素抽取规则对样本合同进行合同要素抽取, 生成该样本合同的 第二要素化结构合同; 将样本合同的第二要素化结构合同与基于用户标注的要素化结构合同进行比对; 判定二者不一致或区别度大于预设阈值时发出要素抽取规则风险预警。 7.根据权利要求6所述的方法, 其特征在于: 形成该样本合同的第 二个性化要素抽取规 则的步骤如下: 根据样本合同的文档章节顺序, 依顺序获取样本合同对应的多个合同类型, 包括合同 类型1、 合同类型2、 ……、 合同类型N, 其中, N 为大于等于2的整数; 依次获取前述合同类型1、 合同类型2、 ……、 合同类型N预设的要素抽取规则, 分别作 为 样本合同的第1段要素抽取规则、 第2段要素抽取规则、 ……、 第N段要素抽取规则; 对前述第一段要素抽取规则 至第N段要素抽取规则按前述合同类型的顺序进行合并后 生成该样本合同的第二个性 化要素抽取规则。 8.根据权利要求1所述的方法, 其特征在于: 所述要素标注信 息包括用户标注的要素关 键词和要素标签, 对应所述要素关键词和要素标签设置有用户选择 的要素抽取规则信息, 所述要素关键词、 要素抽取规则和要素 标签进行映射存 储。 9.一种电子设备, 其特 征在于包括: 至少一个处 理器; 以及, 所述存储器存储有可被所述至少一个处理器执行的计算机程序指令, 所述计算机程序 指令被所述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求1至8中任 一项所述的合同评审方法。 10.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处 理器执行时实现如权利要求1至8中任一项所述的合同要素抽取 方法。权 利 要 求 书 2/2 页 3 CN 114118098 A 3

.PDF文档 专利 基于要素抽取的合同评审方法、设备及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于要素抽取的合同评审方法、设备及存储介质 第 1 页 专利 基于要素抽取的合同评审方法、设备及存储介质 第 2 页 专利 基于要素抽取的合同评审方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:40:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。