全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210244305.1 (22)申请日 2022.03.14 (71)申请人 来也科技 (北京) 有限公司 地址 100080 北京市海淀区丹棱 街3号B座 17层1-43单 元 (72)发明人 门波 张海雷  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 代理人 杜月 (51)Int.Cl. G06F 16/36(2019.01) G06N 3/08(2006.01) (54)发明名称 结合RPA及AI的知识图谱构建方法、 装置、 终 端及存储介质 (57)摘要 本申请涉及计算机技术领域, 尤其涉及一种 结合RPA及AI的知 识图谱构建方法、 装置、 终端及 存储介质。 一种结合RPA及AI的知识图谱构建方 法, 包括: 获取针对知识图谱构建功能所输入的 数据集合; 通过机器人流程自动化RPA系统, 采用 三元组抽取技术获取数据集合中至少一个数据 对应的三元 组信息集合; 采用第一深度学习模型 在三元组信息集合中获取第一实体对应的三元 组信息子集, 第一实体对应至少一个称呼信息; 对三元组信息子集中各三元 组信息进行合并, 构 建数据集合对应的知识图谱。 采用本申请, 可 以 提高知识图谱构建的准确性, 可以提高用户的使 用体验。 权利要求书3页 说明书22页 附图8页 CN 114328980 A 2022.04.12 CN 114328980 A 1.一种结合RPA及AI的知识图谱构建方法, 其特 征在于, 包括: 获取针对知识图谱构建功能所输入的数据集 合; 通过机器人流程自动化RPA系统, 采用三元组抽取技术获取所述数据集合中至少一个 数据对应的三元组信息集 合; 采用第一深度学习模型在所述三元组信息集合中获取第一实体对应的三元组信息子 集, 其中, 同一实体对应至少一个称呼信息或同一称呼信息对应至少一个实体; 对所述三元组信息子集中各三元组信息进行合并, 构建所述数据集合对应的知识图 谱。 2.根据权利要求1所述的方法, 其特征在于, 所述采用第 一深度学习模型在所述三元组 信息集合中获取第一实体对应的三元组信息 子集, 包括: 获取所述三元组信息集 合中至少一个三元组信息之间的关系信息; 采用第一深度学习模型和所述关系信 息中的别称属性信 息, 对所述至少一个三元组信 息进行实体对齐处 理, 获取第一实体对应的三元组信息 子集。 3.根据权利要求2所述的方法, 其特征在于, 所述同一实体对应至少一个称呼信息, 所 述采用第一深度学习模型和所述关系信息中的别称属性信息, 对所述至少一个三元组信息 进行实体对齐处 理, 获取第一实体对应的三元组信息 子集, 包括: 基于所述关系信 息中的别称属性信 息, 获取第 一实体对应的至少一个称呼信 息中的第 一称呼信息和第二称呼信息, 所述第一称呼信息为所述至少一个称呼信息中任一称呼信 息, 所述第二称呼信息为至少一个称呼信息中除所述第一称呼信息之外的任一称呼信息; 获取所述第 一称呼信 息对应的第 一三元组信 息子集, 获取所述第 二称呼信 息对应的第 二三元组信息 子集; 基于第一深度学习模型、 所述第一三元组信息子集和所述第二三元组信息子集, 获取 所述第一实体对应的三元组信息 子集。 4.根据权利要求1所述的方法, 其特征在于, 所述同一称呼信息对应至少一个实体, 所 述采用第一深度学习模型在所述三元组信息集合中获取第一 实体对应的三元组信息子集, 包括: 获取所述三元组信 息集合中所述同一称呼信 息对应的至少一个三元组信 息, 所述同一 称呼信息对应至少一个实体; 获取所述至少一个三元组信息之间的关系信息; 采用第一深度学习模型和所述关系信 息中的别称属性信 息, 对所述至少一个三元组信 息进行实体对齐处 理, 获取所述至少一个实体中各实体对应的三元组信息 子集。 5.根据权利要求1至4中任一项所述的方法, 其特 征在于, 所述方法还 包括: 获取训练样本数据和验证样本数据; 采用所述训练样本数据对第二深度学习模型进行训练, 得到第三深度学习模型; 采用所述验证样本数据对所述第三深度学习模型进行验证, 得到第一深度学习模型。 6.根据权利要求5所述的方法, 其特征在于, 所述第 二深度学习模型为预训练 的语言表 征Bert模型, 所述第三深度学习模型为实体对齐Base模型, 所述采用所述训练样本数据对 第二深度学习模型进行训练, 得到第三深度学习模型, 包括: 采用所述训练样本数据对所述预训练的语言表征Bert模型进行训练, 得到所述实体对权 利 要 求 书 1/3 页 2 CN 114328980 A 2齐Base模型。 7.根据权利要求5所述的方法, 其特征在于, 在所述采用所述验证样本数据对所述第 三 深度学习模型进行验证, 得到第一深度学习模型之后, 还 包括: 获取所述第一深度学习模型对应的公共语言规范CLS编码信息; 将所述CLS编码信息替换成令牌to ken编码信息 。 8.根据权利要求5所述的方法, 其特征在于, 在所述采用所述验证样本数据对所述第 三 深度学习模型进行验证, 得到第一深度学习模型之后, 还 包括: 采用所述第一深度学习模型在第二数据集合中获取第二实体对应的第一正样本数据 子集和第一负 样本数据子集; 获取所述第 一正样本数据子集对应的第 一数据数量, 获取所述第 一负样本数据子集对 应的第二数据数量; 若所述第一数据 数量和所述第 二数据数量的比值不满足第 一比值条件, 则对所述第 一 深度学习模型中的损失函数进行修改, 得到修改后的第一深度学习模型。 9.根据权利要求8所述的方法, 其特征在于, 在所述获取所述正样本数据子集对应的第 一数据数量之后, 还 包括: 若所述第一数据 数量小于数量阈值, 则对所述第 一正样本数据子集中的各数据进行数 据增强处 理。 10.根据权利要求8所述的方法, 其特征在于, 所述对所述第一深度学习模型中的损失 函数进行修改, 得到修改后的第一深度学习模型, 包括: 对所述第一深度学习模型中的损失函数FocalLoss进行权重参数的修改, 得到修改后 的第一深度学习模型; 采用所述修改后的第一深度学习模型在所述第二数据集合中重新获取所述第二实体 对应的第二 正样本数据子集和第二负 样本数据子集; 获取所述第 二正样本数据子集对应的第 三数据数量, 获取所述第 二负样本数据子集对 应的第四数据数量; 若所述第三数据 数量和所述第四数据 数量的比值满足第 二比值条件, 则停止对所述修 改后的第一深度学习模型的修改, 并存 储所述修改后的第一深度学习模型。 11.一种结合RPA及AI的知识图谱构建装置, 其特 征在于, 包括: 集合获取单元, 用于获取针对知识图谱构建功能所输入的数据集 合; 所述集合获取单元, 还用于通过机器人流程自动化RPA系统, 采用三元组抽取技术获取 所述数据集 合中至少一个数据对应的三元组信息集 合; 信息获取单元, 用于采用第 一深度学习模型在所述三元组信 息集合中获取第 一实体对 应的三元组信息子集, 其中, 同一实体对应至少一个称呼信息或同一称呼信息对应至少一 个实体; 图谱构建单元, 用于对所述三元组信息子集中各三元组信息进行合并, 构建所述数据 集合对应的知识图谱。 12.根据权利要求11所述的装置, 其特征在于, 所述信息获取单元, 用于采用第一深度 学习模型在所述 三元组信息集 合中获取第一实体对应的三元组信息 子集时, 具体用于: 获取所述三元组信息集 合中至少一个三元组信息之间的关系信息;权 利 要 求 书 2/3 页 3 CN 114328980 A 3

.PDF文档 专利 结合RPA及AI的知识图谱构建方法、装置、终端及存储介质

文档预览
中文文档 34 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共34页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 结合RPA及AI的知识图谱构建方法、装置、终端及存储介质 第 1 页 专利 结合RPA及AI的知识图谱构建方法、装置、终端及存储介质 第 2 页 专利 结合RPA及AI的知识图谱构建方法、装置、终端及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:59:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。