全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210429292.5 (22)申请日 2022.04.22 (71)申请人 阿里巴巴 (中国) 有限公司 地址 311121 浙江省杭州市余杭区五常街 道文一西路969号3幢5层5 54室 (72)发明人 林廷恩 武玉川 李永彬 孙健  (74)专利代理 机构 北京智信禾专利代理有限公 司 11637 专利代理师 刘晓楠 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/31(2019.01) G06F 40/194(2020.01) G06F 40/279(2020.01)G06F 40/30(2020.01) (54)发明名称 基于智能对话的相似问题确定方法及装置 (57)摘要 本说明书实施例提供基于智能对话的相似 问题确定方法及装置, 其中所述基于智能对话的 相似问题确定方法包括: 获取至少一个标准问 题, 并基于每个标准问题获取每个标准问题对应 的待处理相似问题; 根据每个待处理相似问题和 每个待处理相似问题对应的标准问题, 确定每个 标准问题对应的待处理相似问题的质量分数; 基 于每个标准问题对应的待处理相似问题的质量 分数筛选每个标准问题对应的目标相似问题。 权利要求书2页 说明书17页 附图5页 CN 115017277 A 2022.09.06 CN 115017277 A 1.一种基于智能对话的相似问题确定方法, 包括: 获取至少一个标准问题, 并基于每个标准问题获取每个标准问题对应的待处理相似问 题; 根据每个待处理相似问题和每个待处理相似问题对应的标准问题, 确定每个标准问题 对应的待处 理相似问题的质量分数; 基于每个标准问题对应的待处理相似问题的质量分数筛选每个标准问题对应的目标 相似问题。 2.如权利要求1所述的方法, 所述确定每个标准问题对应的待处理相似问题的质量分 数, 包括: 确定目标 标准问题和所述目标 标准问题对应的目标待处 理相似问题; 根据每个目标待处理相似问题和所述目标标准问题确定每个目标待处理相似问题的 质量分数。 3.如权利要求2所述的方法, 所述根据每个目标待处理相似问题和所述目标标准问题 确定每个目标待处 理相似问题的质量分数, 包括: 将目标标准问题以及与目标标准问题对应的目标待处理相似问题输入至分数排序模 型; 获取所述分数排序模型输出的排序结果, 其中, 所述排序结果中包含目标标准问题对 应的每个目标待处 理相似问题的质量分数。 4.如权利要求1所述的方法, 所述基于每个标准问题获取每个标准问题对应的待处理 相似问题, 包括: 对每个标准问题进行 预处理, 获得每 个标准问题对应的待处 理标准问题; 根据预设获取策略和每个待处理标准问题获取与每个待处理标准问题对应的待处理 相似问题。 5.如权利要求4所述的方法, 所述根据预设获取策略和每个待处理标准问题获取与每 个待处理标准问题对应的待处 理相似问题, 包括: 将每个待处理标准问题输入至相似问题生成模型, 并获取所述相似问题生成模型输出 的每个待处理标准问题对应的待处 理相似问题; 或 基于预设检索策略和每个待处理标准问题在目标数据库中获取每个待处理标准问题 对应的待处 理相似问题; 或 基于每个待处理标准问题和预设模板生成每个待处理标准问题对应的待处理相似问 题。 6.如权利要求1所述的方法, 所述获取至少一个标准问题之前, 还 包括: 获取基础对话数据、 人人对话数据和人机对话数据, 并对所述基础对话数据、 人人对话 数据和人机对话数据进行 预处理, 生成检索数据库; 基于预设数据筛选策略在所述检索数据库筛选目标数据, 并基于所述目标数据生成 目 标数据库。 7.如权利要求1所述的方法, 所述获取至少一个标准问题之前, 还 包括: 获取对话日志数据, 并基于预设标注规则对所述对话日志数据进行标注, 获得标注数 据;权 利 要 求 书 1/2 页 2 CN 115017277 A 2基于所述标注数据训练相似问题生成模型、 分数排序模型和/或质量模型。 8.如权利要求1所述的方法, 所述基于每个标准问题对应的待处理相似问题的质量分 数筛选每个标准问题对应的目标相似问题, 包括: 将每个待处理相似问题输入至质量模型; 获取所述质量模型输出的包 含质量标签的待处 理相似问题; 根据每个待处理相似问题对应的质量标签在待处理相似问题中筛选每个标准问题对 应的目标相似问题。 9.如权利要求1所述的方法, 所述基于每个标准问题对应的待处理相似问题的质量分 数筛选每个标准问题对应的目标相似问题, 包括: 确定预设质量分数阈值, 并将质量分数大于所述预设质量分数阈值的待处理相似问题 作为目标相似问题; 或 确定预设排序规则, 并基于所述预设排序规则对每个待处理相似问题进行排序获得相 似问题序列, 在所述相似问题序列中选取预设相似问题数量的待处理相似问题作为目标相 似问题。 10.如权利要求8所述的方法, 所述根据每个待处理相似问题对应的质量标签在待处理 相似问题中筛 选每个标准问题对应的目标相似问题, 包括: 确定每个标准问题对应的待处 理相似问题的质量标签的标签 类型; 将质量标签的标签类型为第一标签类型的待处理相似问题作为每个标准问题对应的 目标相似问题。 11.如权利要求1所述的方法, 所述基于每个标准问题对应的待处理相似问题的质量分 数筛选每个标准问题对应的目标相似问题之后, 还 包括: 计算每个标准问题对应的目标相似问题之间的相似度, 并确定预设相似度阈值; 删除相似度大于预设相似度阈值的目标相似问题。 12.一种基于智能对话的查询 相似问题确定方法, 包括: 获取至少一个查询标准问题, 并基于每个查询标准问题获取每个查询标准问题对应的 待处理查询相似问题; 根据每个待处理查询相似问题和每个待处理查询相似问题对应的查询标准问题, 确定 每个查询标准问题对应的待处 理查询相似问题的质量分数; 基于每个查询标准问题对应的待处理查询相似问题的质量分数筛选每个查询标准问 题对应的目标查询 相似问题。 13.一种计算设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机指令, 所述处理器执行所述计算机指 令时实现权利要求 1‑11或12任意一项 所述方法的步 骤。 14.一种计算机可读存储介质, 其存储有计算机可执行指令, 该计算机指令被处理器执 行时实现权利要求1 ‑11或12任意 一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115017277 A 3

.PDF文档 专利 基于智能对话的相似问题确定方法及装置

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于智能对话的相似问题确定方法及装置 第 1 页 专利 基于智能对话的相似问题确定方法及装置 第 2 页 专利 基于智能对话的相似问题确定方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:49:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。