(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211367866.7 (22)申请日 2022.11.03 (65)同一申请的已公布的文献号 申请公布号 CN 115422377 A (43)申请公布日 2022.12.02 (73)专利权人 中科雨辰科技有限公司 地址 100093 北京市海淀区清琴麓 苑170号 楼2层 (72)发明人 张正义 刘宸 傅晓航 林方  (74)专利代理 机构 北京锺维联合知识产权代理 有限公司 1 1579 专利代理师 安娜 (51)Int.Cl. G06F 16/38(2019.01) G06F 16/36(2019.01)(56)对比文件 CN 108268582 A,2018.07.10 CN 111222918 A,2020.0 6.02 CN 112699667 A,2021.04.23 US 2014280 089 A1,2014.09.18 US 2022253477 A1,202 2.08.11 CN 114201587 A,202 2.03.18 审查员 王晓燕 (54)发明名称 一种基于知识图谱的搜索系统 (57)摘要 本申请涉及电数字数据处理技术领域, 特别 是涉及一种基于知识图谱的搜索系统。 该系统包 括的存储器存储有知识图谱, 其包括N个实体的 信息; 该系统还包括处理器和存储有计算机程序 的存储介质, 当所述计算机程序被处理器执行 时, 实现以下步骤: 获取用户输入的实体E X; 获取 与EX匹配的实体的标签; 如果LA ≠∅, 则输出标签 包含LAk且不与EX匹配的实体; 否则, 获取与EX匹 配的实体的属性名; 如果PA ≠∅, 则获取与E X匹配 的实体的PAb对应的属性值; 遍历PA, 如果PAb对 应属性值均相同, 则输出具有属性名PAb、 PAb对 应的属性值为VA1且不与EX匹配的实体。 本发明 实现了对与用户输入的多个实体属于同类的实 体的搜索和输出。 权利要求书2页 说明书6页 附图1页 CN 115422377 B 2022.12.27 CN 115422377 B 1.一种基于知识图谱的搜索系统, 其特征在于, 包括存储器, 所述存储器存储有知识图 谱, 所述知识图谱包括N个实体的信息{M1, M2,…, Mn,…, MN}, Mn为第n个实体的信息, n的取值 范围为1到N; Mn=(En, Ln, Pn, Vn), En为第n个实体, Ln为En的标签, Pn为En的属性名, Vn为Pn对应 的属性值; Ln=(Ln1, Ln2,…, Lni,…, LnI), Lni为En的第i个标签, i的取值范 围为1到I, I为En的 标签数量; Pn=(Pn1, Pn2,…, Pnj,…, PnJ), Pnj为En的第j个属性名, j的取值范围为1到J, J为En 的属性名数量; Vn=(Vn1, Vn2,…, Vnj,…, VnJ), Vnj为Pnj对应的属性 值; 所述系统还包括处理器和存储有计算机程序的存储介质, 当所述计算机程序被处理器 执行时, 实现以下步骤: S100, 获取用户输入的实体EX=(EX1, EX2,…, EXq,…, EXQ), EXq为用户输入的第q个实体, q的取值范围为1到Q, Q 为用户输入的实体数量, Q≥2; S200, 获取所述知识图谱中与EX匹配的实体的标签(LX1, LX2,…, LXq,…, LXQ), 其中, LXq 为所述知识图谱中与EXq匹配的实体的标签; S300, 如果LX1∩LX2∩…∩LXQ=LA≠∅, LA={LA1, LA2,…, LAk,…, LAK}, 则输出所述知识图 谱中标签包含LAk且不与EX匹配的实体; LAk为EX1, EX2,…, EXQ共有的第k个标签, k的取值为1 到K, K为EX1, EX2,…, EXQ共有的标签数量; 如果 LX1∩LX2∩…∩LXQ=LA=∅, 则进入S40 0; S400, 获取所述知识图谱中与EX匹配的实体的属性名(PX1, PX2,…, PXq,…, PXQ), 其中, PXq为所述知识图谱中与EXq匹配的实体的属性名; S500, 如果PX1∩PX2∩…∩PXQ=PA≠∅, PA={PA1, PA2,…, PAb,…, PAB}, 则获取所述知识图 谱中与EX匹配的实体的PAb对应的属性值{VAb1, VAb2,…, VAbq,…, VAbQ}, VAbq为所述知识图谱 中与EXq匹配的实体的PAb对应的属性值; PAb为EX1, EX2,…, EXQ共有的第b个属性名, b的取值 为1到B, B为EX1, EX2,…, EXQ共有的属性名数量; S600, 遍历PA, 如果VAb1=VAb2=…=VAbQ, 则输出所述知识图谱中具有属性名PAb、 PAb对应 的属性值为VAb1且不与EX匹配的实体。 2.根据权利要求1所述的系统, 其特征在于, S600中, 如果不满足VAb1=VAb2=…=VAbQ, 则 输出所述知识图谱中属性名为PAb且不与EX匹配的实体。 3.根据权利要求1所述的系统, 其特征在于, S300中, 如果LX1∩LX2∩…∩LXQ=LA≠∅, 则 还输出包括 LAk的第一文本 。 4.根据权利要求1所述 的系统, 其特征在于, S500中, 如果PX1∩PX2∩…∩PXQ=PA=∅, 则 输出指示没有相同标签和 属性名的第二文本 。 5.根据权利要求1所述的系统, 其特征在于, 如果S300中LX1∩LX2∩…∩LXQ=LA≠∅, 还 进入S701; S701, 获取所述知识图谱中不与EX匹配的实体的标签与LA的交集{mix1, mix2,…, mixe,…, mixE}, mixe为所述知识图谱 中不与EX匹配的第 e个实体的标签与LA的交集, e的取 值范围为1到 E, E=N‑Q; S702, 按照mixe包括的标签数量由大到小的顺序对{ mix1, mix2,…, mixe,…, mixE}进行 重新排列, 得到{mix ’1, mix’2,…, mix’e,…, mix’E}, mix’e为重新排列后的第e个元 素; S703, 获取{mix ’1, mix’2,…, mix’e,…, mix’E}中与重新排列后的mix ’1具有相同标签数 量的元素数量T; S704, 输出{mix ’1, mix’2,…, mix’T}对应的实体, 并指示{mix ’1, mix’2,…, mix’T}对应权 利 要 求 书 1/2 页 2 CN 115422377 B 2的实体为与EX 具有最多相同标签数量的实体。 6.根据权利要求1所述的系统, 其特征在于, 如果S300中LX1∩LX2∩…∩LXQ=LA≠∅, 还 进入S711; S711, 获取所述知识图谱中不与EX匹配的实体的标签与LA的交集, 如果交集为 ∅, 则设 置知识图谱中不与EX匹配的实体的第一匹配度为第一预设值; 如果交集不为 ∅, 则设置知识 图谱中不与EX匹配的实体的第一匹配度为第二预设值, 第二预设值大于第一预设值, 第一 预设值大于等于 0; S712, 如果PX1∩PX2∩…∩PXQ=PA≠∅, 则获取所述知识图谱中不与EX匹配的实体的属 性名与PA的交集, 如果交集为 ∅, 则设置知识图谱中不与EX匹配的实体的第二匹配度为第三 预设值; 如果交集不为 ∅, 则设置知识 图谱中不与EX匹配的实体的第二匹配度为第四预设 值, 第四预设值大于第三预设值, 第三预设值大于等于 0; S713, 获取所述知识图谱中不与EX匹配的实体的目标总值, 所述目标总值为对应实体 的第一目标值与第二 目标值之和, 第一 目标值为第一匹配度与第一权重之积, 第二 目标值 为第二匹配度与第二权 重之积; S714, 输出目标总值 为最大目标总值的实体。 7.根据权利要求6所述的系统, 其特征在于, 第一权重大于第二权重, 第二权重大于0, 第一权重与第二权 重之和为1。 8.根据权利要求7 所述的系统, 其特 征在于, 第一预设值=第三预设值= 0。权 利 要 求 书 2/2 页 3 CN 115422377 B 3

.PDF文档 专利 一种基于知识图谱的搜索系统

安全报告 > 其他 > 文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的搜索系统 第 1 页 专利 一种基于知识图谱的搜索系统 第 2 页 专利 一种基于知识图谱的搜索系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-17 23:39:05上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。