全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210071371.3 (22)申请日 2022.01.21 (71)申请人 联想 (北京) 有限公司 地址 100085 北京市海淀区上地西路6号2 幢2层201- H2-6 (72)发明人 朱砡赐 葛娜 朱琴  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 代理人 王欢 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/33(2019.01) G06F 40/258(2020.01) G06F 40/279(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种信息处 理方法和装置 (57)摘要 本申请提供了一种信息处理方法和装置, 目 标知识图谱中具有多个主题的要素包, 每个主题 的要素包中包括初始要素和潜在要素, 其中, 初 始要素是其所属主题对应的历史事件中记载的 词, 潜在要素是基于该初始要素确定的; 在 目标 知识图谱中确定与待处理事件对应的至少一个 目标要素, 该待处理事件的目标要素至少包括一 个主题的初始要素和/或潜在要素, 基于该至少 一个目标要素以及目标要素在目标知识图谱中 的权重值得到待处理事件的要素参数, 基于该要 素参数, 生成的预测 信息结合了一个或者多个主 题的信息, 而该主题中的要素是基于历史事件确 定, 相对于只基于该待处理事件中的信息, 本方 案中生成的预测信息结合了多个历史事件的信 息, 预测更加准确。 权利要求书3页 说明书16页 附图7页 CN 114417013 A 2022.04.29 CN 114417013 A 1.一种信息处 理方法, 包括: 获取待处 理事件; 在目标知识图谱中至少一个主题的要素包中, 确定与待处理事件对应的至少一个目标 要素, 任一主题的要素包包括初始要素和潜在要素, 所述初始要素为所属主题对应的历史 事件中记载的词, 所述潜在要素 是基于所述初始要素确定的; 基于所述至少一个目标要素以及所述目标要素在所述目标知识图谱中的权重值, 得到 所述待处理事件的要素参数, 所述至少一个目标要素包括至少一个主题的初始要素和/或 潜在要素; 基于所述要素参数, 生成预测信息 。 2.根据权利要求1所述的方法, 所述获取待处 理事件之前, 还 包括: 分析至少一个历史事 件, 得到至少一组词集 合; 基于所述至少一个词集合, 确定在原始知识图谱中相应的至少一个主题的初始要素、 潜在要素以及至少一个主题范围; 依次在所述原始知识图谱的至少一个主题中每个主题的范围内, 确定所述初始要素的 权重值、 所述潜在要素的权 重值; 基于所述初始要素及其权 重值、 潜在要素及其权 重值得到所述主题的要素包; 基于至少一个主题的要素包得到所述目标知识图谱。 3.根据权利要求2所述的方法, 所述基于所述至少一个词集合, 确定在原始知识图谱中 相应的至少一个主题的初始要素、 潜在要素以及至少一个主题范围, 包括: 将所述至少一个词集合中的第 一词集合映射到原始知识图谱, 得到所述第 一词集合在 所述原始知识图谱上对应的第一节点, 所述第一节点作为第一主题的初始要素; 基于所述第 一主题的初始要素, 确定所述原始知识图谱中与 所述第一主题相应的潜在 要素以及主题范围。 4.根据权利要求3所述的方法, 所述基于所述第 一主题的初始要素, 确定所述原始知识 图谱中与所述第一主题相应的潜在要素以及主题范围, 包括: 在所述原 始知识图谱中确定第二节点, 所述第二节点是与所述第一节点 不同的节点; 基于所述第 一节点的预设权重、 第 二节点的预设权重以及所述原始知识图谱中第 一节 点与第二节点之间的距离, 得到所述第一节点与第二节点的传播 概率; 如果所述第 一节点与第 二节点的传播概率大于第 一预设阈值, 确定所述第 二节点为潜 在要素; 基于所述原始知识图谱中第 一主题的初始要素与潜在要素的分布范围, 确定所述第 一 主题的主题范围。 5.根据权利要求3所述的方法, 在任一主题的范围内, 确定所述初始要素的权重值、 所 述潜在要素的权 重值, 包括: 基于所述第 一节点的预设权重以及所述初始要素的预设权重, 得到所述任一主题中所 述初始要素的权 重值; 基于所述初始要素的权重值、 所述潜在要素对应的第二节点的预设权重、 以及第一节 点与第二节点之间的距离, 得到所述任一主题中所述潜在要素的权 重值。 6.根据权利要求1所述的方法, 所述在目标知识图谱中至少一个主题的要素包中, 确定权 利 要 求 书 1/3 页 2 CN 114417013 A 2与待处理事件对应的至少一个目标要素, 包括: 基于所述待处理事件获得关键信息, 得到关键信息词集, 所述关键信息词集中至少包 括至少一个词; 依次将所述关键信 息词集中的词映射到所述目标知识图谱, 得到所述关键信 息词集在 所述知识图谱上对应的至少一个目标要素。 7.根据权利要求6所述的方法, 基于所述待处理事件获得关键信息, 得到关键信息词 集, 至少包括以下一种: 对于所述待处理事件提取关键信息, 得到至少一个关键信息; 获取与所述关键信息相 近的至少一个扩展词, 将所述至少一个扩展词作为所述关键信息的候选词; 基于所述关键 信息与所述关键信息的候选词, 得到关键信息词集; 对所述待处理事件提取得到至少两个词; 统计所述至少两个词, 得到满足相似条件的 至少两个词; 确定目标词作为关键信息, 与所述 目标词满足相似条件的至少一个词作为扩 展词, 将所述至少一个扩展词作为所述关键信息的候选词, 每个候选词与所述关键信息具 有相似度; 基于所述关键信息与所述关键信息的候选词, 得到关键信息词集。 8.根据权利要求6所述的方法, 所述关键信息词集中包括关键信息以及所述关键信息 的候选词, 所述依 次将所述关键信息词集中的词映射到所述 目标知识图谱, 得到所述关键 信息词集在所述目标知识图谱上对应的至少一个目标要素, 包括: 如果在所述目标知识图谱中查找到与所述关键信 息词集中第 一词对应的第 三节点, 将 所述第三节点作为目标要 素; 如果在所述目标知识图谱中未查找到与所述关键信息词集中 第一词对应的第三节点, 按照候选词的相似度顺序, 在所述 目标知识图谱中查找与所述候 选词对应的第四节点, 将所述第四节点作为目标要素; 所述基于所述至少一个目标要素以及所述目标要素在所述目标知识图谱中的权重值, 得到所述待处 理事件的要素参数, 包括: 基于所述目标知识图谱中目标要素的权重值以及所述候选词与关键信 息的相似度, 得 到所述待处 理事件的要素参数。 9.根据权利要求1所述的方法, 至少一个目标要素包括至少两个主题的初始要素和/或 潜在要素的情况下, 所述基于所述至少一个目标要素以及所述目标要 素在所述目标知识图 谱中的权 重值, 得到所述待处 理事件的要素参数, 包括: 确定所述目标要素 所属的至少两个主题; 基于属于同一主题的至少一个目标要素的权重值, 确定所述主题中所述目标要素的要 素参数; 所述基于所述要素参数, 生成预测信息, 包括: 基于要素参数将所述至少两个主题进行排序, 确定满足约定条件的至少一个主题的要 素参数; 基于所述满足约定条件的至少一个主题的要素参数, 生成预测信息 。 10.一种信息处 理装置, 包括: 获取模块, 用于获取待处 理事件; 确定模块, 用于在目标知识图谱中至少一个主题的要素包中, 确定与待处理事件对应 的至少一个目标要素, 任一主题的要素包包括初始要素和潜在要素, 所述初始要素为所属权 利 要 求 书 2/3 页 3 CN 114417013 A 3

.PDF文档 专利 一种信息处理方法和装置

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种信息处理方法和装置 第 1 页 专利 一种信息处理方法和装置 第 2 页 专利 一种信息处理方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:51:23上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。