(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211031111.X (22)申请日 2022.08.26 (71)申请人 大连理工大 学 地址 116024 辽宁省大连市甘井 子区凌工 路2号 (72)发明人 马战川 张立和 孔雨秋 陈思龙  尹宝才  (74)专利代理 机构 大连理工大 学专利中心 21200 专利代理师 戴风友 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/33(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称 一种基于上下文信息融合的知识图谱补全 方法 (57)摘要 本发明属于自然语 言处理技术领域, 具体涉 及一种基于上下文信息融合的知识图谱补全方 法。 本发明首次利用3D卷积处理知 识图谱上下文 信息, 并引入头尾双关系来解决复杂关系的编码 问题。 首先使用实体关系编码模块对输入的实体 关系对进行编码得到实体关系特征; 再使用上下 文编码模块对输入的上下文信息进行编码得到 上下文特征; 然后将实体关系特征和上下文特征 输入到特征融合模块进行特征融合得到查询向 量; 最后计算查询向量与候选尾实体向量的相似 度得到不同候选实体的得分。 本发明利用3D卷积 对上下文结构信息进行特征提取, 将其融入实体 关系特征中, 在多个常用的数据集上进一步提高 知识图谱补全方法的准确率。 权利要求书3页 说明书5页 附图3页 CN 115408536 A 2022.11.29 CN 115408536 A 1.一种基于上 下文信息融合的知识图谱补全方法, 其特 征在于, 步骤 包括: 步骤S1: 数据预处理; 根据数据集中三元组数据, 构建算法的输入数据, 包括实体关系 对、 上下文信息对和候选实体列表; 步骤S2: 将实体关系对输入实体关系编码模块, 得到实体关系特 征; 步骤S21: 将实体关系对进行初始化嵌入, 得到实体关系矩阵; 步骤S22: 将实体关系矩阵分别输入多个不同的2D卷积网络进行特征提取, 得到多个不 同尺度的实体关系特 征, 然后将多个实体关系特 征拼接在一 起得到初始实体关系特 征; 步骤S23: 初始实体关系特 征经过全连接层映射改变嵌入维度得到实体关系特 征; 步骤S3: 将一组上 下文信息对输入上 下文编码模块, 得到多个上 下文特征; 步骤S31: 将实体关系对所对应的一组上下文信息对进行初始化嵌入, 得到多个上下文 嵌入; 步骤S32: 多个上 下文嵌入顺序拼接在一 起得到上 下文嵌入; 步骤S33: 将上下文嵌入输入3D卷积网络进行 特征提取, 得到一组上 下文特征; 步骤S4: 将实体关系特 征和一组上 下文特征输入到特 征融合模块, 得到查询向量; 步骤S41: 将实体关系特征和一组上下文特征输入Transformer网络, 得到初始查询向 量; 步骤S42: 将初始查询向量输入多层感知机, 得到查询向量; 步骤S5: 计算 查询向量与候选实体之间的相似度, 得到候选实体的概 率分布; 步骤S51: 将候选实体列表进行初始化嵌入, 得到候选实体嵌入; 步骤S52: 基于余弦相似度计算查询向量与候选实体嵌入的相似度得分; 然后经过 sigmoid函数计算得到候选实体的概 率分布; 步骤S6: 最小化整体损失函数训练整个算法, 使算法预测结果拟合正确结果; 所得的整 个算法模型即为知识图谱补全方法的工具。 2.根据权利要求1所述的一种基于上下文信 息融合的知识图谱补全方法, 其特征在于, 所述步骤S1具体为: 步骤S11: 数据集中出现的头实体h和尾实体t, 构成集 合E, 即为 候选实体列表; 步骤S12: 对于给定的三元组<h,r,t>, 取其中的头实体h和关系r构成实体关系对p:<h, r>; 步骤S13: 为每个实体关系对构 建上下文结构信息; 对于给定的实体关系对p:<h,r>, 在 数据集中找到所有与p具有相同实体h或相同关系r的实体关系对的集合c, 即为 实体关系对 p对应的上下文信息对列表, 而 所有c构成的集合C, 是所有实体 关系对所对应的上下文信息 对的集合。 3.根据权利要求1或2所述的一种基于上下文信 息融合的知识图谱补全方法, 其特征在 于, 所述步骤S2具体为: 步骤S21: 将实体关系对p分别进行初始化嵌入, 得到实体嵌入Eh∈R1×d和关系嵌入Er∈ R1×d, 其中d是知识图谱表征的嵌入 维度; 然后将Eh和Er进行拼接和重塑操作, 得到实体关系 矩阵 其中, d1和d2分别是实体关系矩阵的宽和高, 满足条件d1×d2=2d; 步骤S22: 将实体关系矩阵Mp分别输入3个不同的2D卷积网络进行特征提取, 得到3个实权 利 要 求 书 1/3 页 2 CN 115408536 A 2体关系特征 然后将三个实体关系特征拼接在一起得到初始实体关系特征 fp∈R1×3d, 即定义 其中[; ]表示 拼接; 步骤S23: 将fp输入全连接层改变嵌入维度得到实体关系特 征Fp∈R1×d。 4.根据权利要求1或2所述的一种基于上下文信 息融合的知识图谱补全方法, 其特征在 于, 所述步骤S3具体为: 步骤S31: 将实体关系对p所对应的上下文信息对c按照步骤S21所描述的方式进行处 理, 得到n个上下文嵌入矩阵 其中n代表上下文信息对的个数, j∈[1,n]代表第 j个上下文信息对, d1和d2分别是上下文嵌入的宽和高, 满足条件d1×d2=2d, d是知识图谱 表征的嵌入维度; 步骤S32: 将n个上下文嵌入Vc拼接在一起得到上下文嵌入 即定义 其中[; ]表示 拼接操作; 步骤S33: 将上下文嵌入Mc输入3D卷积网络进行特征提取, 得到n个上下文特征 5.根据权利要求3所述的一种基于上下文信 息融合的知识图谱补全方法, 其特征在于, 所述步骤S3具体为: 步骤S31: 将实体关系对p所对应的上下文信息对c按照步骤S21所描述的方式进行处 理, 得到n个上下文嵌入矩阵 其中n代表上下文信息对的个数, j∈[1,n]代表第 j个上下文信息对, d1和d2分别是上下文嵌入的宽和高, 满足条件d1×d2=2d, d是知识图谱 表征的嵌入维度; 步骤S32: 将n个上下文嵌入Vc拼接在一起得到上下文嵌入 即定义 其中[; ]表示 拼接操作; 步骤S33: 将上下文嵌入Mc输入3D卷积网络进行特征提取, 得到n个上下文特征 6.根据权利要求1或2或5所述的一种基于上下文信息融合的知识图谱补全方法, 其特 征在于, 所述 步骤S4具体为: 步骤S41: 将实体关系特征Fp和n个上下文特征 输入Transformer网络, 得到 初始查询向量q∈R1×d, 其中Transformer网络由6层相同的Transformer层堆叠而成, 每 一层 都是只使用Transformer的编码模块; 步骤S42: 将初始查询向量q输入多层感知机, 得到查询向量Q∈R1×d, 其中多层感知 机是 由全连接层、 Relu层、 全连接层组成。 7.根据权利要求3所述的一种基于上下文信 息融合的知识图谱补全方法, 其特征在于, 所述步骤S4具体为: 步骤S41: 将实体关系特征Fp和n个上下文特征 输入Transformer网络, 得到 初始查询向量q∈R1×d, 其中Transformer网络由6层相同的Transformer层堆叠而成, 每 一层 都是只使用Transformer的编码模块; 步骤S42: 将初始查询向量q输入多层感知机, 得到查询向量Q∈R1×d, 其中多层感知 机是 由全连接层、 Relu层、 全连接层组成。权 利 要 求 书 2/3 页 3 CN 115408536 A 3

.PDF文档 专利 一种基于上下文信息融合的知识图谱补全方法

安全报告 > 其他 > 文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于上下文信息融合的知识图谱补全方法 第 1 页 专利 一种基于上下文信息融合的知识图谱补全方法 第 2 页 专利 一种基于上下文信息融合的知识图谱补全方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-17 23:38:05上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。