全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210146333.X (22)申请日 2022.02.17 (71)申请人 北京邮电大 学 地址 100876 北京市海淀区西土城路10号 北京邮电大 学新科研楼627室 (72)发明人 鄂海红 宋美娜 许友日  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 杜月 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019.01) G06F 16/36(2019.01) G06K 9/62(2022.01) (54)发明名称 一种基于时序知识图谱的复杂问答查询方 法和装置 (57)摘要 本发明公开了一种基于时序知识图谱的复 杂问答查询方法和装置, 其中, 该方法包括: 获取 时序问题并将时序问题输入训练好的问答系统 模型; 其中, 问答系统模 型包括: 时序知识嵌入模 型、 嵌入提取模型、 时间变化模型和答案评分模 型; 利用时序知识嵌入模型获取时序问题中的实 体嵌入和时间嵌入, 并利用嵌入提取模型获取时 序问题的潜在嵌入; 以及利用时间变化模型将时 间嵌入变换到时序问题的目标时间下; 使用答案 评分模型对实体嵌入的实体和目标时间进行评 分, 并输出得分最高的实体或时间作为时序问题 的答案。 本发 明将潜在的嵌入变换到问题的目标 时间, 能够提升复杂 时序问题的处理能力, 并简 化复杂问题的处 理过程。 权利要求书3页 说明书7页 附图3页 CN 114637819 A 2022.06.17 CN 114637819 A 1.一种基于时序知识图谱的复杂问答 查询方法, 其特 征在于, 包括以下步骤: 获取时序问题并将所述时序问题输入训练好的问答系统模型; 其中, 所述问答系统模 型包括: 时序知识嵌入 模型、 嵌入提取模型、 时间变化模型和答案 评分模型; 利用所述 时序知识嵌入模型获取所述 时序问题中的实体嵌入和时间嵌入, 并利用所述 嵌入提取模型获取所述时序问题的潜在嵌入; 以及, 利用所述时间变化模型将所述时间嵌 入变换到所述时序问题的目标时间下; 使用所述答案评分模型对所述实体嵌入的实体和所述目标时间进行评分, 并输出得分 最高的实体或时间作为所述时序问题的答案 。 2.根据权利要求1所述的方法, 其特 征在于, 对所述时序知识嵌入 模型进行训练, 包括: 获取时序知识图谱并输入所述问答系统模型; 使用TComplEx 模型在所述时序知识图谱上训练, 获得 所述实体嵌入和时间嵌入; 若所述TComplEx模型训练结果未达到第一预设指标, 则调整所述时序知识嵌入模型超 的参数, 继续所述TComplEx 模型在所述时序知识图谱上训练的步骤; 若达到所述第一预设指标, 则获取用于所述问答系统模型训练的时序问题样本 。 3.根据权利要求2所述的方法, 其特 征在于, 对所述问答系统模型进行训练, 包括: 将所述时序问题样本输入所述问答系统模型, 并利用所述问答系统模型在所述时序问 题样本上进行训练; 若所述问答系统模型的训练结果未达到第 二预设指标, 则调 整所述问答系统模型的超 参数, 继续所述问答系统模型在所述时序问题样本上进行训练的步骤; 若达到所述第二预设指标, 则结束对所述问答系统模型的训练。 4.根据权利 要求3所述的方法, 其特征在于, 所述使用TComplEx模型在所述时序知识图 谱上训练, 获得 所述实体嵌入和时间嵌入, 包括: 利用ComplEx模型分别将实体、 关系和时间戳表示为复数向量, 以获得任一四元组真实 性的得分函数为: 根据所述得分函数完成TComplEx模型的训练, 以获得实体嵌入、 关系嵌入和时间嵌入, 以及根据所述实体嵌入、 关系嵌入和时间嵌入查询单个事 件的能力。 5.根据权利要求4所述的方法, 其特征在于, 所述利用所述嵌入提取模型获取所述 时序 问题的潜在嵌入, 包括: 使用DistilBert模型编码 时序问题q, 利用DistilBert模型最后一个隐层状态和全连 接层FFN表示提取时序问题q的表示 为如下关系: hq=FFN(Disti lBert(q)) 每个时序问题q至少标注一个实体s, 使用知识图谱嵌入表示s的嵌入为es=us, 使用所 述全连接层FFN提取关系表 示er=FFNr(hq), 若时序问题q的目标时间和目标尾实体缺失, 则 使用2个全连接层F FN分别提取潜在时间和尾实体的嵌入: etime=FFN(hq), eo=FFN(hq) 。 6.根据权利要求5所述的方法, 其特征在于, 所述利用所述 时间变化模型将所述时间嵌 入变换到所述时序问题的目标时间下, 包括:权 利 要 求 书 1/3 页 2 CN 114637819 A 2拼接四个实体、 关系和时间的潜在嵌入, 并送入 全连接层F FN: 与时序问题q的隐层状态 表示拼接后送入 全连接层F FN: 将潜在的时序嵌入变换为目标时间嵌入: 其中, 代表对应元 素相乘。 7.根据权利要求6所述的方法, 其特征在于, 所述使用所述答案评分模型对所述实体嵌 入的实体和所述目标时间进行评分, 并输出得分最高的实体或时间作为所述时序问题的答 案, 包括: 基于实体或时间为时序问题的答案, 使用两个全连接层FFN分别提取两个关系表示 和 使用TComplex模型的得分函数和变换后的嵌入, 衡量所述时序问题答案的得 分: 衡量每个时间t为时序问题答案的得分函数为: 将所有实体的得分与所有时间的得分拼接后, 送入softmax函数后得到归一化的概率, 以输出得分最高的实体或时间作为 答案。 8.一种基于时序知识图谱的复杂问答 查询装置, 其特 征在于, 包括: 输入模块, 用于获取时序问题并将所述时序问题输入训练好的问答系统模型; 其中, 所 述问答系统模型包括: 时序知识嵌入 模型、 嵌入提取模型、 时间变化模型和答案 评分模型; 提取模块, 用于利用所述 时序知识嵌入模型获取所述 时序问题中的实体嵌入和时间嵌 入, 并利用所述 嵌入提取模型获取所述时序问题的潜在嵌入; 以及, 利用所述时间变化模型 将所述时间嵌入变换到所述时序问题的目标时间下; 输出模块, 用于使用所述答案评分模型对所述实体嵌入的实体和所述目标时间进行评 分, 并输出 得分最高的实体或时间作为所述时序问题的答案 。 9.根据权利要求8所述的装置, 其特 征在于, 还 包括第一训练模块, 包括: 第一获取模块, 用于获取时序知识图谱并输入所述问答系统模型; 第一训练子模块, 用于使用TComplEx模型在所述时序知识图谱上训练, 获得所述实体 嵌入和时间嵌入; 第二训练子模块, 用于若所述TComplEx模型训练结果未达到第一预设指标, 则调整所 述时序知识嵌入 模型超的参数, 继续所述第一训练子模块; 第三训练子模块, 用于若达到所述第一预设指标, 则获取用于所述问答系统模型训练 的时序问题样本 。 10.根据权利要求9所述的装置, 其特 征在于, 还 包括第二训练模块, 包括: 第四训练子模块, 用于将所述时序问题样本输入所述问答系统模型, 并利用所述问答 系统模型在所述时序问题样本上进行训练;权 利 要 求 书 2/3 页 3 CN 114637819 A 3

.PDF文档 专利 一种基于时序知识图谱的复杂问答查询方法和装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于时序知识图谱的复杂问答查询方法和装置 第 1 页 专利 一种基于时序知识图谱的复杂问答查询方法和装置 第 2 页 专利 一种基于时序知识图谱的复杂问答查询方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。