全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210133285.0 (22)申请日 2022.02.14 (65)同一申请的已公布的文献号 申请公布号 CN 114218405 A (43)申请公布日 2022.03.22 (73)专利权人 科大讯飞 (苏州) 科技有限公司 地址 215000 江苏省苏州市工业园区金鸡 湖大道88号E4单元 (72)发明人 张汀依 李直旭 瞿剑锋 陈志刚  吴瑞萦  (74)专利代理 机构 深圳市威世博知识产权代理 事务所(普通 合伙) 44280 专利代理师 刘希 (51)Int.Cl. G06F 16/36(2019.01)G06F 40/295(2020.01) (56)对比文件 US 10055450 B1,2018.08.21 CN 113836318 A,2021.12.24 审查员 徐霞 (54)发明名称 知识抽取方法及相关方法和相关装置、 电子 设备、 介质 (57)摘要 本申请公开了一种知识抽取方法及相关方 法和相关装置、 电子设备、 介质。 该方法包括: 基 于时间对各实体和各关系的影 响模型, 提取目标 三元组的第一知识表示; 其中, 目标三元组包括 目标头实体、 目标关系和目标尾实体, 第一知识 表示包含目标头实体、 目标关系和目标尾实体三 者的个体知识表示, 且个体知识表 示所包含的各 维嵌入表 示是分别提取得到的; 基于第一知 识表 示, 提取目标三元组的第二知识表示; 融合第一 知识表示和第二知识表示, 得到目标三元组的目 标知识表示。 通过上述方式, 从时间对各实体和 各关系的影 响模型的角度, 根据三元组的各维嵌 入表示分别提取得到三元组的个体知识表示, 从 而使得知识 表示的事实更加准确。 权利要求书3页 说明书18页 附图6页 CN 114218405 B 2022.08.16 CN 114218405 B 1.一种知识抽取方法, 其特征在于, 所述方法用于获取商品信 息以及用户的交互信 息, 根据所述商品信息和所述交互信息 建立时序知识图谱, 基于所述时序知识图谱进 行知识抽 取, 以对商品进行评 分预测, 最 终根据评 分顺序得到所述商品的推荐 结果, 所述知识抽取方 法包括: 基于时间对各实体和各关系的影响模型, 提取目标三元组的第一知识表示; 其中, 所述 目标三元组包括目标头实体、 目标关系和目标尾实体, 所述第一知识表示包含所述 目标头 实体、 所述 目标关系和所述 目标尾实体三者的个体知识表示, 且所述个体知识表示所包含 的各维嵌入表示是分别提取得到的; 其中, 所述目标头实体为用户信息, 所述目标关系为用 户的交互信息, 所述目标尾实体为所述商品信息; 基于所述第 一知识表示, 提取所述目标三元组的第 二知识表示; 其中, 所述第 二知识表 示为所述目标头实体、 所述目标关系和所述目标尾实体三者基于各维嵌入表示融合的事实 级知识表示; 融合所述第一知识表示和所述第二知识表示, 得到所述目标三元组的目标知识表示; 其中, 所述 目标知识表示为所述 目标头实体、 所述 目标关系和所述 目标尾实体三者基于所 述第一知识 表示和所述第二知识 表示的多粒度信息的融合特 征表示。 2.根据权利要求1所述的方法, 其特征在于, 所述影响模型定义有确定性影响因素和非 确定性影响因素, 各维所述嵌入表示分别基于对应维度的第一嵌入表示和 第二嵌入表示融 合得到, 且所述第一嵌入表示基于所述确定性影响因素提取得到, 所述第二嵌入表示基于 所述非确定性影响因素提取 得到。 3.根据权利要求2所述的方法, 其特征在于, 所述目标头实体或所述目标尾实体的第 一 嵌入表示的提取步骤 包括: 基于待提取实体的确定性影响因素, 获取所述待提取实体在 当前维度的确定性因素时 间表示和 确定性因素属性表示; 基于所述确定性因素时间表示和所述确定性因素属性表示, 得到所述待提取实体在所 述当前维度的第一嵌入表示; 其中, 在所述实体为所述目标头实体的情况下, 所述当前维度的第一嵌入表示为所述 目标头实体在所述当前维度的第一嵌入表示, 在所述实体为所述 目标尾实体的情况下, 所 述当前维度的第一嵌入表示 为所述目标尾实体在所述当前维度的第一嵌入表示。 4.根据权利要求3所述的方法, 其特征在于, 所述确定性影响因素包含周期性因素、 趋 势性因素至少一种; 其中, 所述周期性因素对应的确定性因素属性表示包括: 周期性波动幅值、 周期性特征 和周期性偏置, 所述趋势性因素对应的确定性因素属 性表示包括: 趋势性特征和趋势性偏 置。 5.根据权利要求2所述的方法, 其特征在于, 所述目标关系的第 一嵌入表示包括对应维 度的确定性语义信息 。 6.根据权利要求2所述的方法, 其特征在于, 所述目标头实体或所述目标尾实体或所述 目标关系的第二嵌入表示的提取步骤 包括: 基于待提取目标的非确定性影响因素, 获取所述待提取目标在当前维度的非确定性因 素时间表示和非确定性因素属性表示;权 利 要 求 书 1/3 页 2 CN 114218405 B 2基于所述非确定性因素时间表示和所述非确定性因素属性表示, 得到所述待提取目标 在所述当前维度的第二嵌入表示; 其中, 在所述待提取目标为所述目标头实体的情况下, 所述当前维度的第二嵌入表示 为所述目标头实体在所述当前维度的第二嵌入表 示, 在所述待提取目标为所述目标尾实体 的情况下, 所述当前维度的第二嵌入表示为所述目标尾实体在所述当前维度的第二嵌入表 示, 在所述待提取目标为所述 目标关系的情况下, 所述当前维度的第二嵌入表示为所述 目 标关系在所述当前维度的第二嵌入表示。 7.根据权利要求6所述的方法, 其特征在于, 所述非确定性因素属性表示包括: 非确定 性波动特 征。 8.根据权利要求2所述的方法, 其特征在于, 所述基于所述第一知识表示, 提取所述目 标三元组的第二知识 表示, 包括: 基于所述目标头实体、 所述目标关系、 所述目标尾实体三者的个体知识表示各维所述 第一嵌入表示, 得到所述目标三元组的确定性表示; 以及, 基于所述目标头实体、 所述目标关系、 所述目标尾实体三者的个体知识表示各维所述 第二嵌入表示, 得到所述目标三元组的非确定性表示; 融合所述确定性表示和所述非确定性表示, 得到所述目标三元组的第二知识 表示。 9.根据权利要求8所述的方法, 其特征在于, 所述第 二知识表示由所述非确定表示与随 机波动表示的相乘结果与所述确定性表示融合得到 。 10.根据权利要求1所述的方法, 其特征在于, 所述融合所述第一知识表示和所述第二 知识表示, 得到所述目标三元组的目标知识 表示, 包括: 获取目标关系在正向三元组中的第 一属性表示, 并获取所述目标关系在 反向三元组中 的第二属性表示; 基于所述第 一知识表示、 所述第 二知识表示、 所述第 一属性表示和所述第 二属性表示, 融合得到所述目标三元组的目标知识 表示。 11.根据权利要求10所述的方法, 其特征在于, 所述基于所述目标知识表示、 所述第一 属性表示和所述第二属性表示, 融合得到所述目标三元组的目标知识 表示, 包括: 获取所述第 一知识表示和所述第 二知识表示两者之间的共性特征表示、 个性特征表示 中至少一 者; 基于所述共性特征、 所述个性特征中至少一者, 以及所述第 一知识表示、 所述第 二知识 表示、 所述第一属性表示和所述第二属性表示, 融合得到所述目标知识 表示。 12.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取所述目标三元组的目标知识 表示; 基于所述目标知识表示进行检测, 得到所述目标三元组的检测结果; 其中, 所述检测结 果包括所述目标三元组合理存在的可能性。 13.一种知识抽取装置, 其特征在于, 所述装置用于获取商品信息以及用户的交互信 息, 根据所述商品信息和所述交互信息建立时序知识图谱, 基于所述时序知识图谱进行知 识抽取, 以对商品进 行评分预测, 最 终根据评 分顺序得到所述商品的推荐 结果, 所述知识抽 取装置包括: 知识表示提取模块, 用于提取目标三元组的第一知识表示, 以及基于所述第一知识表权 利 要 求 书 2/3 页 3 CN 114218405 B 3

.PDF文档 专利 知识抽取方法及相关方法和相关装置、电子设备、介质

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 知识抽取方法及相关方法和相关装置、电子设备、介质 第 1 页 专利 知识抽取方法及相关方法和相关装置、电子设备、介质 第 2 页 专利 知识抽取方法及相关方法和相关装置、电子设备、介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:59:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。