全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211162818.4 (22)申请日 2022.09.23 (71)申请人 上海喜马拉雅科技有限公司 地址 201100 上海市闵行区紫星路58 8号2 幢2062室 (72)发明人 鲁俊  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 张欣欣 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/953(2019.01) G06F 16/36(2019.01) G06F 16/335(2019.01) G06F 16/28(2019.01)G06K 9/62(2022.01) (54)发明名称 标题核心内容确定方法、 搜索请求处理方法 及相关装置 (57)摘要 本发明提供的一种标题核心内容确定方法、 搜索请求处理方法及相关装置, 涉及人工智能服 务领域。 所述标题核心内容确定方法: 首先, 获取 待推荐专辑在预设时间范围内的多条历史点击 记录; 然后, 基于每条历史点击记录中的搜索文 本, 得到待推荐专辑的标题的参考核心内容和参 考核心内容的类型; 若参考核心内容为多个、 且 每个参考核心内容的类型均不相同, 则利用预先 构建的知识 图谱确定每个参考核心内容与其余 参考核心内容的关系; 最后, 根据每个参考核心 内容与其余参考核心内容的关系, 得到满足预设 条件的参考核心内容, 并作为待推荐专辑的标题 的核心内容, 从而避免专辑的标题中蹭热度的内 容对搜索引擎的干扰, 使搜索引擎准确理解标题 的核心内容。 权利要求书2页 说明书10页 附图3页 CN 115455294 A 2022.12.09 CN 115455294 A 1.一种标题核心内容确定方法, 其特 征在于, 所述方法包括: 获取待推荐专辑在预设时间范围内的多条历史点击记录, 其中, 每条所述历史点击记 录均包括用户输入的搜索文本; 基于每条所述历史点击记录中的搜索文本, 得到所述待推荐专辑的标题的参考核心内 容和所述 参考核心内容的类型; 若所述参考核心内容为多个、 且每个所述参考核心内容的类型均不相同, 则利用预先 构建的知识图谱确定每 个所述参考核心内容与其 余参考核心内容的关系; 根据每个所述参考核心内容与其余参考核心内容的关系, 得到满足预设条件的参考核 心内容, 并将满足预设条件的参 考核心内容作为所述待推荐专辑的标题的核心内容。 2.如权利要求1所述的方法, 其特征在于, 所述基于每条所述历史点击记录 中的搜索文 本, 得到所述待推荐专辑的标题的参 考核心内容和所述 参考核心内容的类型的步骤 包括: 根据所述待推荐专辑的标题和每条所述历史点击记录 中的搜索文本, 得到所述待推荐 专辑的标题的每 个待定核心内容; 利用预先构建的词典和预先训练的实体提取模型处理每条所述历史点击记录中的搜 索文本, 得到 至少一个实体集 合; 基于每个所述待定核心内容和每个所述实体集合, 得到所述参考核心内容和所述参考 核心内容的类型。 3.如权利要求2所述的方法, 其特征在于, 所述根据 所述待推荐专辑的标题和每条所述 历史点击记录中的搜索 文本, 得到所述待推荐专 辑的标题的至少一个待定核心内容的步骤 包括: 对所述多条历史点击记录中的搜索文本进行去重处 理, 得到至少一个候选文本; 针对每个所述候选文本, 将所述搜索文本为所述候选文本的历史点击记录的数量与 所 述历史点击记录的总 数量的比值, 作为所述候选文本对应的专辑点击率, 得到每个所述候 选文本对应的专辑 点击率; 根据所述专辑 点击率, 从所有候选文本中确定每 个目标文本; 将每个所述目标文本与所述待推荐专辑的标题的重合部分, 均作为一个所述待定核心 内容。 4.如权利要求2所述的方法, 其特征在于, 每个所述实体集合均有对应的实体类型, 所 述基于每个所述待定核心内容和每个所述实体集合, 得到所述参考核心内容和所述参考核 心内容的类型的步骤 包括: 针对每个所述待定核心内容, 若所有实体集合中存在目标集合, 则将所述待定核心内 容作为一个所述参考核心内容, 并将所述目标集合对应的实体类型作为所述参考核心内容 的类型, 其中, 所述目标集 合中存在实体名与待定核心内容相同的实体; 若所有实体集 合中不存在所述目标集 合, 则保留所述待定核心内容; 若每个所述核心内容均不能作为所述参考核心内容, 则将所述待推荐专辑的标题作为 所述参考核心内容, 并将所述 参考核心内容的类型设置为预设类型。 5.如权利要求1所述的方法, 其特征在于, 所述根据每个所述参考核心内容与其余所述 参考核心内容的关系, 得到满足预设条件的参 考核心内容的步骤 包括: 针对每个所述参考核心内容, 若存在与所述参考核心内容相关的其余参考核心内容,权 利 要 求 书 1/2 页 2 CN 115455294 A 2则判定所述 参考核心内容满足预设条件; 若不存在与 所述参考核心内容相关的其余参考核心内容, 则判定所述参考核心内容不 满足预设条件。 6.一种搜索请求处 理方法, 其特 征在于, 所述方法包括: 获取用户搜索请求, 所述用户搜索请求包括用户输入的搜索文本; 计算所述搜索文本与每个待推送专辑的标题的核心内容之间的相似度, 其中, 所述待 推送专辑的标题的核心内容是利用如权利要求1~5任一项所述的标题核心内容确定方法 得到的; 按照所述相似度的大小, 依次推送每 个所述待推送 专辑, 以响应所述用户搜索请求。 7.一种标题核心内容确定装置, 其特 征在于, 所述装置包括: 第一获取模块, 用于获取待推荐专辑在预设时间范围内的多条历史点击记录, 其中, 每 条所述历史点击记录均包括用户输入的搜索文本; 第一处理模块, 用于: 基于每条所述历史点击记录中的搜索文本, 得到所述待推荐专辑的标题的参考核心内 容和所述 参考核心内容的类型; 若所述参考核心内容为多个、 且每个所述参考核心内容的类型均不相同, 则利用预先 构建的知识图谱确定每 个所述参考核心内容与其 余参考核心内容的关系; 根据每个所述参考核心内容与其余参考核心内容的关系, 得到满足预设条件的参考核 心内容, 并将满足预设条件的参 考核心内容作为所述待推荐专辑的标题的核心内容。 8.一种搜索请求处 理装置, 其特 征在于, 所述装置包括: 第二获取模块, 用于获取用户搜索请求, 所述用户搜索请求包括用户输入的搜索文本; 第二处理模块, 用于计算所述搜索文本与每个待推送专辑的标题的核心内容之间的相 似度, 其中, 所述待推送专辑的标题的核心内容是利用如权利要求1~5任一项所述的标题 核心内容确定方法得到的; 推送模块, 用于按照所述相似度的大小, 依次推送每个所述待推送专辑, 以响应所述用 户搜索请求。 9.一种计算机设备, 其特征在于, 其包括存储器和处理器, 所述存储器存储有计算机程 序, 所述处理器执行所述计算机程序时实现如权利要求 1~5任一项 所述的标题核心内容确 定方法, 和/或, 权利要求6所述的搜索请求处 理方法。 10.一种计算机可读存储介质, 其特征在于, 其存储有计算机程序, 所述计算机程序被 处理器执行时实现如权利要求 1~5任一项 所述的标题核心内容确定方法, 和/或, 权利要求 6所述的搜索请求处 理方法。权 利 要 求 书 2/2 页 3 CN 115455294 A 3

.PDF文档 专利 标题核心内容确定方法、搜索请求处理方法及相关装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 标题核心内容确定方法、搜索请求处理方法及相关装置 第 1 页 专利 标题核心内容确定方法、搜索请求处理方法及相关装置 第 2 页 专利 标题核心内容确定方法、搜索请求处理方法及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:43:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。