(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210407494.X
(22)申请日 2022.04.19
(71)申请人 同方知网数字出版技 术股份有限公
司
地址 100192 北京市海淀区西小口路6 6号
东升科技园B2 楼
申请人 同方知网 (北京) 技 术有限公司
(72)发明人 马宇柔 段飞虎 吕强 印东敏
滕康 钱鹏 顾君 张宏伟
(74)专利代理 机构 北京天奇智新知识产权代理
有限公司 1 1340
专利代理师 陈新胜
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)G06F 16/332(2019.01)
G06F 16/33(2019.01)
G06F 16/31(2019.01)
G06F 16/901(2019.01)
G06N 5/02(2006.01)
G06N 5/04(2006.01)
(54)发明名称
一种面向知识图谱的问答推理方法
(57)摘要
本发明公开了一种面向知识图谱的问答推
理方法, 包括: 设计图谱 数据概念, 创建实体及实
体属性三元 组, 并将每个图谱构建实体 关系三元
组; 将所有的三元组数据进行数据规范化处理;
将实体与实体属性三元组中的实体、 属性值与属
性编号于实体表或关系表内作为其中一个待训
练数据集, 将每个图谱构建的实体 关系三元组中
的头实体和尾实体标号于一个实体表内, 作为另
一个待训练数据集; 训练 “关系‑属性二分类模
型”; 依次训练创建的两份数据集并生成两个模
型; 设定允许输入三种格式待求解的三元组, 将
实体和关系分别计算与知识库中已有的文本相
似度, 链接到知识表示模型中, 并进入对应的核
心知识表 示模型求出结果; 接收用户对答案的反
馈, 并将推理正确但模型中不存在的内容存入或
将推理错 误后用户输入正确答案的内容存 入。
权利要求书1页 说明书5页 附图2页
CN 114691891 A
2022.07.01
CN 114691891 A
1.一种面向知识图谱的问答推理方法, 其特 征在于, 所述方法包括:
A、 设计图谱数据概念, 创建实体及实体属性三元组, 并将每个 图谱构建实体关系三元
组;
B、 将所有的三元组数据进行 数据规范化处 理;
C、 将实体与实体属性三元组中的实体、 属性值与属性编号于实体表或关系表内作为其
中一个待训练数据集, 将 每个图谱构建的实体关系三元组中的头实体和尾实体标号于一个
实体表内, 作为另一个待训练数据集;
D、 训练“关系‑属性二分类模型 ”;
E、 依次训练创建实体 ‑关系数据集和实体 ‑属性数据集, 并生成两个知识 表示模型;
F、 设定允许输入三种格 式待求解的三元组, 将 实体和关系分别计算与知识库中已有的
文本相似度, 链接 到知识表示模型中, 并进入 对应的核心知识 表示模型求出 结果;
G、 接收用户对答案的反馈, 并将推理正确但模型中不存在的内容存入或将推理错误后
用户输入正确答案的内容存 入。
2.如权利要求1所述的面向知识图谱的问答推理方法, 其特征在于, 所述A具体包括: 通
过试验数据中的实体按照[实体entity ‑属性attribute ‑属性值value]的形式创建多个实
体及实体属性三元组, 即[e,a,v]; 每个图谱按照[头实体(head),关系(relation),尾实体
(tail)]格式构建实体关系三元组, 即[h,r,t]。
3.如权利要求1所述的面向知识图谱的问答推理方法, 其特征在于, 所述步骤B中数据
规范化处理具体包括三元组数据的补全、 矫正以及实体消岐, 其中, 实体消歧包括在实体识
别和关系识别之前进行深度学习的消歧及采用关系词典和主体词典进行匹配消歧。
4.如权利要求1所述的面向知识图谱的问答推理方法, 其特征在于, 所述步骤C具体包
括: 将[e,a,v]中的e和 v都看作实体, 编号在一个实体表 中, 将a看做是关系, 编号在关系表
内, 鉴于[e,a,v]和[h,r,t]在模型训练逻辑上具有相似性, [e,a,v]之后统称为[h,r,t], 作
为第一待训练数据集; 将[h,r,t]中的h和t编号在一个实体表内, 将r编号在关系表内, 作为
第二待训练数据集。
5.如权利要求1所述的面向知识图谱的问答推理方法, 其特征在于, 所述步骤D中使用r
训练“关系‑属性二分类模型 ”。
6.如权利要求1所述的面向知识图谱的问答推理方法, 其特征在于, 所述步骤E中具体
包括, 采用dgl ‑ke命令行工具创建嵌入, 选择一个或多个模型依次训练第一数据集和第二
数据集生成两个模型。
7.如权利要求1所述的面向知识图谱的问答推理方法, 其特征在于, 所述步骤F具体包
括输入三种格式待 求解的三元组[h,r,? ],[? ,r,h],[h,? ,t], 针对第一种格式, 将r通过 “关
系‑属性二分类模型 ”判断是属性还是关系, 将h和r分别计算与知识库中已有的文本相似
度, 链接到知识表示模型中, 最终进入 对应的核心知识 表示模型求出 结果。权 利 要 求 书 1/1 页
2
CN 114691891 A
2一种面向知识图谱的问答 推理方法
技术领域
[0001]本发明涉及自然语言处理和计算机信息处理技术领域, 尤其涉及一种面向知识图
谱的问答推理方法。
背景技术
[0002]知识推理技术, 顾名思义, 是根据已有的知识推理出未知的知识, 从而获取到新的
知识。 面向知识图谱的知识推理, 则是通过利用已有的完整的三元组, 来为 实体或者关系的
三元组进 行补全。 主要围绕关系的推理展开, 基于图谱中已有的关系推断出未知关系, 一般
着重考察实体、 关系和图谱 结构三个方面的特征信息。 这项技术的应用十 分广泛, 但在智能
问答方面的应用在处于起步 阶段。 由于知识推理可丰富图谱中实体间千丝万缕的关系, 在
优化问答理解的方面能够起到 重要的作用。
[0003]智能问答服务已经存在于生活中的方方面面, 例如自动客服系统、 语音对话机器
人等等, 随着计算机技术和自然语言处理技术的发展, 人们对智能问答型产品中使用的技
术有了更高的要求, 传统的智能问答服务可以做到机器理解、 智能学习、 自动问答、 人机交
互, 具体又可划分为以机器客服为代表的线上服务及以问答机器人为代表的线下服务, 极
大的方便了人们的日常生活。 问答的关键技术主要涉及三个方面: 检索技术、 知识网络、 深
度学习。
[0004]问答系统可分为面向任务、 面向知识和面向聊天三类, 而面向知识的问答系统包
括问答对知识库和知识图谱知识库, 随着智能问答技术的发展, 知识推理逐渐成为其内在
驱动力之一, 本发明重点研究两者之间的融合创新, 采用面向知识图谱的知识推理方法, 根
据图谱中三元组知识库, 构建一种问答推理新方法, 应用于智能问答系统。 且在初次搭建问
答知识图谱库时, 人工录入三元组数据容易出现构建不规范等问题, 或是直接从网络上获
取他人分享的一些不规范 的三元组知识库, 导致一部分实体属 性缺失或者关系缺失, 难以
满足问答要求。 并且图谱中可能存在错误的三元 组数据, 形成一种噪声信息, 降低了问答功
能的精准度。
发明内容
[0005]为解决上述技术问题, 本发明的目的是提供一种面向知识图谱的问答推 理方法该
方法获得 更高质量的答案, 经 过用户反馈或审核后入库, 逐步自我迭代完 善。
[0006]本发明的目的通过以下的技 术方案来实现:
[0007]一种面向知识图谱的问答推理方法, 包括:
[0008]A、 设计图谱数据概念, 创建实体及实体属性三元组, 并将每个图谱构建实体关系
三元组;
[0009]B、 将所有的三元组数据进行 数据规范化处 理;
[0010]C、 将实体与实体属性三元组中的实体、 属性值与属性编号于实体表或关系表内作
为其中一个待训练数据集, 将每个图谱构建的实体关系三元组中的头实体和尾实体标号于说 明 书 1/5 页
3
CN 114691891 A
3
专利 一种面向知识图谱的问答推理方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:55:41上传分享