(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210464942.X
(22)申请日 2022.04.29
(71)申请人 中国农业银行股份有限公司
地址 100005 北京市东城区建国门内大街
69号
(72)发明人 李田雨 吴旭
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
专利代理师 刘翠香
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/332(2019.01)
G06F 16/36(2019.01)
(54)发明名称
一种搜索结果 生成方法和装置
(57)摘要
本申请提供了一种搜索结果生成方法和装
置, 其中, 方法包括: 获取目标用户输入的搜索信
息; 从预设的全资料集合中筛选与搜索信息相关
的资料集合, 作为候选资料集合; 将搜索信息与
历史相关信息进行匹配, 将匹配到的历史相关信
息对应的用户作为候选联系人; 根据搜索信息以
及预先建立的知识图谱和标准问主题语料库, 确
定搜索信息对应的关联资料集合; 根据候选资料
集合、 候选联系人和关联资料集合, 确定搜索信
息对应的搜索结果。 本申请仅输入一次搜索信
息, 就可以返回基于候选资料集合、 候选联系人
和关联资料集合确定的搜索结果, 搜索结果更全
面且更贴合用户使用需求。
权利要求书3页 说明书13页 附图2页
CN 114817471 A
2022.07.29
CN 114817471 A
1.一种搜索结果 生成方法, 其特 征在于, 包括:
获取目标用户输入的搜索信息;
从预设的全资料集 合中筛选与所述搜索信息相关的资料集 合, 作为候选资料集 合;
将所述搜索信 息与历史相关信 息进行匹配, 将匹配到的历史相关信 息对应的用户作为
候选联系人, 其中, 所述历史相关信息包括历史发布的相关资料和/或历史解答用户, 所述
历史解答用户是指 历史解答过相关问题的用户;
根据所述搜索信 息以及预先建立的知识图谱和标准问主题语料库, 确定所述搜索信 息
对应的关联资料集合, 其中, 所述知识图谱基于系统日志数据和存量解决方案数据生成, 所
述标准问主题语料库基于所述存量 解决方案数据生成;
根据所述候选资料集合、 所述候选联系人和所述关联资料集合, 确定所述搜索信息对
应的搜索结果。
2.根据权利要求1所述的搜索结果生成方法, 其特征在于, 所述从预设的全资料集合中
筛选与所述搜索信息相关的资料集 合, 作为候选资料集 合, 包括:
判断所述搜索信息是否为目的类型;
若是, 则从预设的存量解决方案语料库中筛选与所述搜索信息相关的解决方案集合,
并从预设的全页面集合中筛选所述搜索信息相关的页面集合, 筛选出的解决方案集合和页
面集合作为所述 候选资料集 合;
若否, 则从所述存量解决方案语料库中筛选与所述搜索信息相关的解决方案集合, 筛
选出的解决方案集 合作为所述 候选资料集 合。
3.根据权利要求1所述的搜索结果生成方法, 其特征在于, 所述将所述搜索信 息与历史
相关信息进行匹配, 将匹配到的历史相关信息对应的用户作为 候选联系人, 包括:
通过资料匹配模型将所述搜索信 息与所述历史发布的相关资料进行匹配, 并将匹配到
的相关资料对应的用户作为所述候选联系 人, 其中, 所述资料匹配模型为以第一训练搜索
信息为训练数据, 以标注的所述第一训练搜索信息匹配的训练相关资料所对应的用户为样
本标签训练得到;
和/或, 通过用户匹配模型将所述搜索信 息与所述历史解答用户进行匹配, 将匹配到的
历史解答用户作为所述候选联系 人, 其中, 所述用户匹配模型为以第二训练搜索信息为训
练数据, 以标注的所述第二训练搜索信息匹配的训练解 答用户为样本标签训练得到 。
4.根据权利要求1所述的搜索结果生成方法, 其特征在于, 所述根据所述搜索信 息以及
预先建立的知识图谱和标准问主题语料库, 确定所述搜索信息对应的关联资料集 合, 包括:
若所述搜索信息为有效输入, 则将所述搜索信息与所述标准问主题语料库进行匹配,
得到所述搜索信息对应的标准问, 并将所述搜索信息对应的标准问与所述知识图谱进 行匹
配, 得到所述搜索信息对应的关联资料集 合;
若所述搜索信 息为无效输入, 则将所述搜索信 息相关的历史操作序列与所述标准问主
题语料库进行匹配, 得到所述历史操作序列对应的标准问, 并将所述历史操作序列对应的
标准问与所述知识图谱进 行匹配, 匹配到的关联资料集合作为所述搜索信息对应的关联资
料集合, 其中, 所述历史操作序列通过 所述系统日志数据确定 。
5.根据权利要求1所述的搜索结果生成方法, 其特征在于, 所述根据所述候选资料集
合、 所述候选联系人和所述关联资料集 合, 确定所述搜索信息对应的搜索结果, 包括:权 利 要 求 书 1/3 页
2
CN 114817471 A
2将所述候选资料集合中的候选资料分别与 所述搜索信 息进行语义相似度匹配, 获得语
义相似度高的若干个候选资料, 作为目标资料集 合;
将所述目标资料集合、 所述候选联系人和所述关联资料集合作为所述搜索信 息对应的
搜索结果。
6.根据权利要求5所述的搜索结果生成方法, 其特征在于, 所述将所述候选资料集合中
的候选资料分别与所述搜索信息进行语义相似度匹配, 获得语义相似度高的若干个候选资
料, 包括:
通过深度学习预训练语言模型将所述候选资料集合中的候选资料分别与所述搜索信
息进行语义相似度匹配, 获得语义相似度高的若干个候选 资料, 其中, 所述深度学习预训练
语言模型为以训练搜索信息和对应的训练资料为训练数据, 以标注的训练搜索信息与训练
资料的语义相似度为样本标签训练得到 。
7.根据权利要求1所述的搜索结果 生成方法, 其特 征在于, 还 包括:
生成所述搜索结果对应的搜索返回理由, 其中, 所述搜索返回理由用于对返回所述搜
索结果的原因进行解释。
8.根据权利要求1所述的搜索结果生成方法, 其特征在于, 所述知识图谱的建立方法,
包括:
获取所述系统日志数据和所述存量解决方案数据, 其中, 所述系统日志数据用于对用
户在解决问题时的历史使用情况进行记录;
基于所述系统日志数据清洗得到若干个历史操作序列, 并对所述若干个历史操作序列
进行相关 关系和依赖关系抽取, 得到抽取的所述相关 关系和所述依赖关系;
基于所述存量解决方案数据进行标签关系和作者关系抽取, 得到抽取的所述标签关系
和所述作者关系;
基于所述相关关系、 所述依赖关系、 所述标签关系和所述作者关系, 以解决方案、 解答
者和主题标签作为所述知识图谱的三个节点, 建立所述知识图谱。
9.一种搜索结果生成装置, 其特征在于, 包括: 搜索信息获取模块、 候选资料集合确定
模块、 候选联系人确定模块、 关联资料集 合确定模块和搜索结果确定模块;
所述搜索信息获取模块, 用于获取目标用户输入的搜索信息;
所述候选资料集合确定模块, 用于从预设的全资料集合中筛选与所述搜索信 息相关的
资料集合, 作为候选资料集 合;
所述候选联系人确定模块, 用于将所述搜索信息与历史相关信息进行匹配, 将匹配到
的历史相关信息对应的用户作为候选联系 人, 其中, 所述历史相关信息包括历史发布的相
关资料和/或历史解 答用户, 所述历史解 答用户是指 历史解答过相关问题的用户;
所述关联资料集合确定模块, 用于根据所述搜索信 息以及预先建立的知识图谱和标准
问主题语料库, 确定所述搜索信息对应的关联资料集合, 其中, 所述知识图谱基于系统日志
数据和存量 解决方案数据生成, 所述标准问主题语料库基于所述存量 解决方案数据生成;
所述搜索结果确定模块, 用于根据所述候选资料集合、 所述候选联系人和所述关联资
料集合, 确定所述搜索信息对应的搜索结果。
10.根据权利要求9所述的搜索结果生成装置, 其特征在于, 所述候选资料集合确定模
块, 包括: 目的类型判断子模块、 第一候选 资料集合确定子模块和 第二候选 资料集合确定子权 利 要 求 书 2/3 页
3
CN 114817471 A
3
专利 一种搜索结果生成方法和装置
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:55:04上传分享