(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211063198.9 (22)申请日 2022.08.31 (71)申请人 太保科技有限公司 地址 200010 上海市黄浦区中山 南路1号1 1 层(名义楼层)1 1V6室 (72)发明人 武悦娇  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 付丽 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06Q 40/08(2012.01) (54)发明名称 一种关系抽取模型的训练方法及装置 (57)摘要 本申请公开了一种关系抽取模型的训练方 法及装置, 方法包括: 获取样本数据集合, 样本数 据集合中包括多个样本数据, 一个样本数据中包 括一个实体对, 一个关系与样本验证标签, 样本 验证标签用于表示样本数据中实体对与关系之 间的匹配度, 将样本数据输入初始模 型得到实体 对与关系之间的待定验证标签, 利用待定验证标 签与样本验证标签的差异对初始模型进行参数 调整得到关系抽取模型, 利用关系抽取模型进行 关系抽取, 使用本申请公开的保险关系抽取模型 的训练方法可以得到支持零样本的关系抽取模 型。 权利要求书2页 说明书6页 附图3页 CN 115408540 A 2022.11.29 CN 115408540 A 1.一种关系抽取模型的训练方法, 其特 征在于, 包括: 获取样本数据集合, 所述样本数据集合中包括多个样本数据, 一个样本数据中包括一 个实体对, 一个关系与样本验证标签, 所述样本验证标签用于表示样本数据中实体对与关 系之间的匹配度; 将所述样本数据输入初始模型 得到所述实体对与关系之间的待定验证标签; 利用所述待定验证标签与所述样本验证标签的差异对所述初始模型进行参数调整得 到关系抽取模型, 所述关系抽取模型用于关系抽取。 2.根据权利要求1所述的方法, 其特 征在于, 所述关系抽取包括: 将待抽取文本进行实体抽取 得到实体1和实体2; 获取多个待分析关系; 利用实体1, 实体2与多个待分析关系形成多个待分析 数据; 将所述待分析数据输入所述关系抽取模型得到所述实体1, 实体2与多个所述待分析关 系的匹配度; 将匹配度最高的待分析关系作为所述实体1与实体2的关系抽取 结果。 3.根据权利要求1所述的方法, 其特征在于, 所述实体对包括: 保险产品名与保险片段 组成的实体对。 4.根据权利要求1所述的方法, 其特 征在于, 所述关系包括: 保险文本中实体间的关系。 5.根据权利要求1 ‑4任意一项所述的方法, 其特 征在于, 所述方法进一 步包括: 将保险文本作为样本, 将所述保险文本对应的类型作为样本标签训练分类模型, 所述 分类模型的词嵌入层用于将所述保险文本转化为向量, 所述分类模型基于所述向量确定文 本的类型, 所述类型包括标题和段落; 所述将所述样本数据输入初始模型得到所述实体对与关系之间的待定验证标签, 进一 步包括: 基于所述分类模型的词嵌入层将所述样本数据转 化为对应的向量; 将转化后的样本数据输入初始模型 得到所述实体对与关系之间的待定验证标签。 6.一种关系抽取模型的训练装置, 其特 征在于, 包括: 样本数据获取模块, 用于获取样本数据集合, 所述样本数据集合中包括多个样本数据, 一个样本数据中包括一个实体对, 一个关系与样本验证标签, 所述样本验证标签用于表示 样本数据中实体对与关系之间的匹配度; 待定验证标签获取模块, 用于获取待定验证标签, 将所述样本数据输入初始模型得到 所述实体对与关系之间的待定验证标签; 初始模型调整模块, 用于调整初始模型, 利用所述待定验证标签与所述样本验证标签 的差异对所述初始模型进行参数调整得到关系抽取模型, 所述关系抽取模型用于关系抽 取。 7.根据权利要求6所述的装置, 其特 征在于, 所述关系抽取模块包括: 实体抽取模块, 用于进行实体抽取获得实体1和实体2; 待分析关系获取模块, 用于获取待分析关系; 待分析数据生成模块, 用于生成待分析数据, 利用实体1, 实体2与多个待分析关系形成 多个待分析 数据;权 利 要 求 书 1/2 页 2 CN 115408540 A 2待分析数据分析模块, 用于分析待分析数据得到所述实体1, 实体2与多个所述待分析 关系的匹配度; 关系抽取结果确定模块, 用于确定关系抽取结果, 将匹配度最高的待分析关系作为所 述实体1与实体2的关系抽取 结果。 8.根据权利要求6所述的装置, 其特 征在于, 所述装置进一 步包括: 分类模型训练模块, 用于训练分类模型, 将保险文本作为样本, 将所述保险文本对应的 类型作为样本标签训练分类模型, 所述分类模型的词嵌入层用于将所述保险文本转化为向 量, 所述分类模型基于所述向量确定文本的类型, 所述类型包括标题和段落; 向量转化模块: 用于向量转化, 基于所述分类模型的词嵌入层将所述实体对, 实体1与 实体2转化为向量。 9.一种电子设备, 其特 征在于, 包括存 储器和处 理器, 其中: 所述存储器, 用于保存计算机程序; 所述处理器, 用于执行所述计算机程序, 以实现如权利要求1 ‑5任意一项所述的关系抽 取模型的训练方法。 10.一种计算机可读存储介质, 其特征在于, 用于保存计算机程序, 其中, 所述计算机程 序被处理器执行时实现如权利要求1 ‑5任意一项所述的关系抽取模型的训练方法。权 利 要 求 书 2/2 页 3 CN 115408540 A 3

.PDF文档 专利 一种关系抽取模型的训练方法及装置

安全报告 > 其他 > 文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种关系抽取模型的训练方法及装置 第 1 页 专利 一种关系抽取模型的训练方法及装置 第 2 页 专利 一种关系抽取模型的训练方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-17 23:37:37上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。