全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210149253.X (22)申请日 2022.02.18 (65)同一申请的已公布的文献号 申请公布号 CN 114201587 A (43)申请公布日 2022.03.18 (73)专利权人 广州极天信息技 术股份有限公司 地址 510315 广东省广州市海珠区广州大 道南788号自编A7之一 号楼二、 三层 (72)发明人 胡炜梅 陈丽莎 陈锦毅  (74)专利代理 机构 广州粤高专利商标代理有限 公司 44102 专利代理师 禹小明 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01)G06F 16/36(2019.01) G06F 40/295(2020.01) 审查员 程潇杰 (54)发明名称 一种基于本体的搜索意图表达方法及系统 (57)摘要 本发明涉及知识图谱技术领域, 提出一种基 于本体的搜索意图表达方法及系统, 其中包括以 下步骤: 获取用户输入的搜索内容, 对搜索内容 进行分词; 利用预设的基于领域本体的知识图谱 对分词结果进行概念识别, 得到分词结果对应的 概念标签; 根据分词结果对应的概念标签, 从所 述基于领域本体的知识图谱中搜索同义词、 外延 词和/或关联词并进行显示; 用户从显示的同义 词、 外延词和/或关联词中选用目标搜索词, 对选 用的目标搜索词进行组合, 生 成搜索意图表达结 果。 本发明通过对用户输入的搜索内容进行分词 并转换为概念, 再进一步结合基于领域本体的知 识图谱进行推荐词搜索, 有助于完整列举用户意 图的词链表达, 生成更准确的搜索意图表达结 果。 权利要求书3页 说明书7页 附图3页 CN 114201587 B 2022.06.07 CN 114201587 B 1.一种基于 本体的搜索意图表达方法, 其特 征在于, 包括以下步骤: S1、 获取用户输入的搜索内容, 对搜索内容进行分词; S2、 利用预设的基于领域本体的知识图谱对分词结果进行概念识别, 得到分词结果对 应的概念标签; S3、 根据分词结果对应的概念标签, 从所述基于领域本体的知识图谱中搜索同义词、 外 延词和/或关联词并进行显示; 其中, 根据分词结果对应的概念标签从所述基于领域本体的知识图谱中搜索外延词的 步骤包括: 根据分词结果对应的概念标签从所述基于领域本体的知识图谱中搜索同一概念 标签的概念节点, 将与所述概念节点存在上 ‑下位关系和/或整体 ‑部分关系的其他概念节 点中存储的所有词汇作为外延词推荐 进行输出显示; 根据分词结果对应的概念标签从所述基于领域本体的知识图谱中搜索关联词的步骤 包括以下步骤: (1) 根据分词结果对应的概念标签从所述基于领域本体的知识图谱中搜索同一概念标 签的概念节点, 并根据所述概念节点的数据属性和/或对象属性构建概念图谱; 所述概念图 谱以所述概念节点为中心点, 展开得到与所述概念节点的数据属 性和/或对 象属性关联的 其他概念节点; 以概念节点 ‑数据属性、 概念节点 ‑对象属性 ‑其他概念的关联关系, 将相应 概念节点中存 储的所有词汇作为关联词推荐 进行输出显示; (2) 根据关联词推荐中的任一词汇从所述基于领域本体的知识图谱中搜索同义词和/ 或外延词, 将所述关联词推荐中的词汇及其同义词和/或外延词组成关联词推荐词集后输 出显示; S4、 用户从显示的同义词、 外延词和/或关联词中选用目标搜索词, 对选用的目标搜索 词进行组合, 生成搜索意图表达结果; 其中, 所述基于领域本体的知识图谱中的领域本体包括概念集合、 属性集合、 个体集合 和事实集合; 其中, 所述属性集合包括数据属性和对象属性, 所述数据属性包括概念 ‑属性‑ 属性值关系, 所述对象属 性包括概念 ‑属性‑概念的关联关系; 所述概念集合包括若干概念 节点, 所述概念节点中存储有同一概念标签的词汇, 且不同的概念节点与概念节点之间通 过上‑下位关系和整体 ‑部分关系形成树形概念层次结构。 2.根据权利要求1所述的基于本体的搜索意图表达方法, 其特征在于, 所述S2步骤中, 对分词结果进 行概念识别的步骤包括: 根据分词结果在知识图谱的领域本体中匹配概念节 点, 当匹配到一个概念节点, 则根据匹配的概念节点对应的标签对分词结果进 行标记; 当匹 配到多个概念节点, 则根据分词结果的上下文进行自动消歧后, 将消歧后的一个概念标签 对分词结果进行标记, 且当分词结果无上下文或经过消歧后仍存在匹配的多个概念节点, 则将匹配的多个概念节点对应的概念标签进行显示, 由用户选定, 并将用户选定的概念标 签对分词结果进行 标记。 3.根据权利要求1所述的基于本体的搜索意图表达方法, 其特征在于, 所述S3步骤中, 根据分词结果对应的概念标签从所述基于领域本体的知识图谱中搜索同义词的步骤包括: 根据分词 结果对应的概念标签从所述基于领域本体的知识图谱中搜索同一概念标签的概 念节点, 将同一 概念标签的概念节点中存 储的所有词汇作为同义词推荐 进行输出显示。 4.根据权利要求1所述的基于本体的搜索意图表达方法, 其特征在于, 所述S3步骤中,权 利 要 求 书 1/3 页 2 CN 114201587 B 2还包括以下一个或多个步骤: (3) 将所述 概念图谱输出显示; (4) 对用户历史输入的搜索内容及选用的目标搜索词进行记录及分析统计, 将词频最 高的若干个词汇, 以及词链频率 最高的二词 词链、 三词 词链和/或四词 词链进行显示。 5.根据权利要求1~4任一项所述的基于本体的搜索意图表达方法, 其特征在于, 所述S4 步骤中, 生成搜索意图表达结果的步骤包括: 根据用户选用的目标搜索词, 在预设的基于领 域本体的知识图谱中获取目标搜索词对应的概念节点之 间的数据属性和对象属性, 以及概 念节点之间的上 ‑下位关系和整体 ‑部分关系, 将所述目标搜索词对应的概念标签、 根据目 标搜索词对应概念节点的数据属性和/或对 象属性获得的关联概念节点对应的概念标签、 根据目标搜索词对应概念节点的上 ‑下位关系和/或整体 ‑部分关系获得的外延概念节点对 应的概念标签进行组合, 得到若干词链作为搜索意图表达结果。 6.一种基于本体的搜索意图表达系统, 应用权利要求1~5任一项所述的基于本体的搜 索意图表达方法, 其特 征在于, 包括: 人机交互模块, 用于获取用户输入的搜索内容、 用户选用的目标搜索词, 以及显示推荐 词及搜索意图表达结果; 分词模块, 用于对所述人机交 互模块获取的搜索内容进行分词; 知识图谱模块, 所述知识图谱模块存储有预设的基于领域本体的知识图谱; 所述知识 图谱中的领域本体包括概念集合、 属 性集合、 个体集合和事实集合; 其中, 所述属性集合包 括数据属性和对象属性, 所述数据属 性包括概念 ‑属性‑属性值关系, 所述对象属性包括概 念‑属性‑概念的关联关系; 所述概念集合包括若干概念节点, 所述概念节点中存储有同一 概念标签的词汇, 且不同的概念节点与概念节点之 间通过上 ‑下位关系和整体 ‑部分关系形 成树形概念层次结构; 概念识别模块, 用于通过调用所述知识图谱模块对所述分词模块输出的分词结果进行 概念识别, 得到分词结果对应的概念标签; 推荐词生成模块, 用于根据分词结果对应的概念标签, 通过调用所述知识图谱模块搜 索同义词、 外延词和/或关联词作为推荐词, 然后发送至所述人机交 互模块中进行显示; 搜索意图表达生成模块, 用于通过所述人机交互模块获取用户选用的目标搜索词, 调 用所述知识图谱模块 获取目标搜索词对应的概念节点之 间的数据属性和对象属性, 以及概 念节点之间的上下位关系和整体部分关系后进行组合, 得到若干搜索意图表达结果, 然后 发送至所述人机交 互模块中进行显示。 7.根据权利要求6所述的基于本体的搜索意图表达系统, 其特征在于, 所述推荐词生成 模块中包括: 同义词推荐单元, 用于根据分词结果对应的概念标签, 通过调用所述知识图谱模块搜 索同一概念标签的概念节点, 将同一概念标签的概念节点中存储的所有词汇作为同义词推 荐进行输出, 并发送至所述人机交 互模块中进行显示; 外延词推荐单元, 用于根据分词结果对应的概念标签, 通过调用所述知识图谱模块搜 索同一概念标签的概念节点, 将与所述概念节点存在上 ‑下位关系和/或整体 ‑部分关系的 其他概念节点中存储的所有词汇作为外延词推荐进行输出, 并发送至所述人机交互模块中 进行显示;权 利 要 求 书 2/3 页 3 CN 114201587 B 3

.PDF文档 专利 一种基于本体的搜索意图表达方法及系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于本体的搜索意图表达方法及系统 第 1 页 专利 一种基于本体的搜索意图表达方法及系统 第 2 页 专利 一种基于本体的搜索意图表达方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。