说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111676300.8 (22)申请日 2021.12.31 (71)申请人 深圳市欢太科技有限公司 地址 518057 广东省深圳市南 山区粤海街 道高新南一道13号赋安科技大厦B座 207-2 (72)发明人 樊乘源 刘海锋  (74)专利代理 机构 深圳市隆天联鼎知识产权代 理有限公司 4 4232 代理人 刘抗美 (51)Int.Cl. G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 模型训练方法、 信息抽取方法及装置、 电子 设备、 介质 (57)摘要 本公开实施例是关于一种模 型训练方法、 信 息抽取方法及装置、 电子设备、 存储介质, 涉及计 算机技术领域, 该模型训练方法包括: 获取训练 语料, 并确定所述训练语料对应的三元组, 以将 所述三元 组确定为训练数据; 根据所述训练数据 训练多个神经网络模型, 并通过所述多个神经网 络模型对所述训练数据进行类型预测得到预测 三元组; 对所述预测三元组的权重进行调整, 并 根据调整权重后的预测三元 组更新训练数据; 根 据更新后的训练数据对神经网络模型的模型参 数进行调整, 获取信息抽取模型。 本公开的技术 方案能够提高标注的精准度以及模型的准确性。 权利要求书2页 说明书13页 附图7页 CN 114297409 A 2022.04.08 CN 114297409 A 1.一种模型训练方法, 其特 征在于, 包括: 获取训练语料, 并确定所述训练语料对应的三元组, 以将所述 三元组确定为训练数据; 根据所述训练数据训练多个神经网络模型, 并通过所述多个神经网络模型对所述训练 数据进行类型 预测得到预测三元组; 对所述预测三元组的权 重进行调整, 并根据调整权 重后的预测三元组更新训练数据; 根据更新后的训练数据对神经网络模型的模型参数进行调整, 获取信息抽取模型。 2.根据权利要求1所述的模型训练方法, 其特征在于, 所述确定所述训练语料对应的三 元组, 包括: 根据目标关系类型将所述训练数据中的三元组确定为初始三元组, 并根据所述训练数 据的语义信息在所述初始三元组中确定待抽取三元组, 以确定所述 三元组。 3.根据权利要求1所述的模型训练方法, 其特征在于, 所述根据 所述训练数据训练多个 神经网络模型, 包括: 根据所述训练数据得到多个训练数据子集; 将所述多个训练数据子集中的一个训练数据子集作为验证集, 将剩余训练数据子集作 为训练集, 对多个神经网络模型进行训练。 4.根据权利要求3所述的模型训练方法, 其特征在于, 所述将所述多个训练数据子集中 的一个训练数据子集作为验证集, 将剩余训练数据子集作为训练集, 对多个神经网络模型 进行训练, 包括: 将所述多个训练数据子集中的第i个训练数据子集作为验证集, 将剩余训练数据子集 作为训练集; 以第i个神经网络模型的验证集分数值最高为模型训练目标, 对多个神经网络模型中 的第i个神经网络模型进行训练, 并确定训练好的第i个神经网络模型。 5.根据权利要求3所述的模型训练方法, 其特征在于, 所述通过所述多个神经网络模型 对所述训练数据进行类型 预测得到预测三元组, 包括: 通过所述多个神经网络模型对所述训练数据进行预测, 得到多个目标三元组 的多个得 分; 对所述目标三元组的多个得分进行平均处理获取每个目标三元组 的目标得分, 并根据 所述目标 得分确定所述预测三元组。 6.根据权利要求5所述的模型训练方法, 其特征在于, 所述根据 所述目标得分确定所述 预测三元组, 包括: 若所述目标 得分大于第一阈值, 将所述 三元组确定为 候选三元组; 若所述目标得分小于第 二阈值, 或所述目标得分大于第 一阈值且所述三元组未存在于 所述训练数据对应的语义信息中, 将所述三元组确定为待剔除三元组; 其中, 所述第一阈值 大于所述第二阈值。 7.根据权利要求6所述的模型训练方法, 其特征在于, 所述对所述预测三元组 的权重进 行调整, 并根据调整权 重后的预测三元组更新训练数据, 包括: 降低处于所述训练数据中的待剔除三元组 的权重, 增加所述训练数据之外的候选三元 组的权重, 并根据调整权 重后的三元组更新训练数据。 8.根据权利要求6所述的模型训练方法, 其特征在于, 所述根据 更新后的训练数据对神权 利 要 求 书 1/2 页 2 CN 114297409 A 2经网络模型的模型参数进行调整, 获取信息抽取模型, 包括: 调整候选三元组的函数权 重, 并调整 待剔除三元组的函数权 重; 根据所述候选三元组的函数权重以及所述待剔除三元组的函数权重对损失函数进行 更新, 确定目标损失函数; 以所述目标损失函数最小为训练目标, 根据 更新后的训练数据对神经网络模型的模型 参数进行调整, 以获取 所述信息抽取模型。 9.根据权利要求8所述的模型训练方法, 其特征在于, 所述调整候选三元组的函数权 重, 并调整 待剔除三元组的函数权 重, 包括: 根据指标参数确定所述候选三元组 的函数权重, 并根据分数阈值确定所述待剔除三元 组的函数权 重。 10.一种信息抽取 方法, 其特 征在于, 包括: 获取待处 理语料; 通过信息抽取模型对所述待处理语料进行信 息抽取, 获取所述待处理语料对应的预测 结果; 其中, 所述信息抽取模型根据权利要求1 ‑9中任意一项所述的模型训练方法训练得 到。 11.一种模型训练装置, 其特 征在于, 包括: 训练数据获取模块, 用于获取训练语料, 并确定所述训练语料对应的三元组, 以将所述 三元组确定为训练数据; 预测模块, 用于根据所述训练数据训练多个神经网络模型, 并通过所述多个神经网络 模型对所述训练数据进行类型 预测得到预测三元组; 权重调整模块, 用于对所述预测三元组的权重进行调整, 并根据调整权重后的预测三 元组更新训练数据; 模型参数调整模块, 用于根据更新后的训练数据对神经网络模型的模型参数进行调 整, 获取信息抽取模型。 12.一种信息抽取装置, 其特 征在于, 包括: 语料获取模块, 用于获取待处 理语料; 结果确定模块, 用于通过信息抽取模型对所述待处理语料进行信息抽取, 获取所述待 处理语料对应的预测结果; 其中, 所述信息抽取模 型根据权利要求 1‑9中任意一项 所述的模 型训练方法训练得到 。 13.一种电子设备, 其特 征在于, 包括: 处理器; 以及 存储器, 用于存 储所述处 理器的可 执行指令; 其中, 所述处理器配置为经由执行所述可执行指令来执行权利要求1 ‑9任意一项所述 的模型训练方法或权利要求10所述的信息抽取 方法。 14.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求 1‑9任意一项 所述的模型训练方法或权利要求 10所述的信息 抽取方法。权 利 要 求 书 2/2 页 3 CN 114297409 A 3

.PDF文档 专利 模型训练方法、信息抽取方法及装置、电子设备、介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、信息抽取方法及装置、电子设备、介质 第 1 页 专利 模型训练方法、信息抽取方法及装置、电子设备、介质 第 2 页 专利 模型训练方法、信息抽取方法及装置、电子设备、介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:51:16上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。