全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211142759.4 (22)申请日 2022.09.20 (71)申请人 中国平安人寿保险股份有限公司 地址 518000 广东省深圳市福田区益田路 5033号平安金融中心14、 15、 16、 37、 41、 44、 45、 46层 (72)发明人 刘丹  (74)专利代理 机构 深圳众鼎专利商标代理事务 所(普通合伙) 44325 专利代理师 姚章国 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06Q 30/00(2012.01) (54)发明名称 查询文本排序方法、 装置、 计算机设备及存 储介质 (57)摘要 本发明公开了一种查询文本排序方法, 该方 法包括获取目标对话文本, 对目标对话文本进行 召回处理, 得到候选对话文本; 通过预设文本模 型对目标对话文本进行向量处理, 得到目标文本 向量, 并自预设向量库中获取候选文本向量; 将 候选文本向量和目标文本向量输入至预设文本 模型中, 获取候选语义向量以及目标语义向量; 对候选语义向量和目标语义向量进行预测处理, 得到预测值, 并根据预测值对候选对话文本进行 排序处理, 得到文本排序结果。 本申请通过召回 方式进行候选对话文本获取, 使得 获取候选对话 文本内容更全面, 从自预设向量库中获取候选文 本向量, 从而实现了对候选对话文本的快速排 序, 提高了智能客服回复的速度, 进而提升了用 户的体验感。 权利要求书3页 说明书13页 附图3页 CN 115495553 A 2022.12.20 CN 115495553 A 1.一种查询文本排序方法, 其特 征在于, 包括: 获取目标对话文本, 对所述目标对话文本进行召回处 理, 得到候选对话文本; 通过预设文本模型对所述目标对话文本进行向量处理, 得到目标文本向量, 并自预设 向量库中获取与所述 候选对话文本对应的候选文本向量; 将所述候选文本向量和所述目标文本向量输入至所述预设文本模型中, 获取与所述候 选文本向量对应的候选语义向量, 以及与所述目标文本向量对应的目标语义向量; 对所述候选语义向量和所述目标语义向量进行预测 处理, 得到预测值, 并根据所述预 测值对所述 候选对话文本进行排序处 理, 得到文本排序结果。 2.如权利要求1所述的查询文本排序方法, 其特 征在于, 所述获取目标对话文本, 包括: 获取初始对话文本, 对所述初始对话文本进行切词处理, 得到所述初始对话文本中的 至少一个待处 理字词; 对所述待处 理字词进行实体识别, 得到与所述待处 理字词相对应的实体识别结果; 根据与各待处理字词相对应的实体识别结果, 对所述初始对话文本进行过滤, 得到当 前对话文本; 对所述当前对话文本进行补全处 理, 得到目标对话文本 。 3.如权利要求2所述的查询文本排序方法, 其特征在于, 所述对所述当前对话文本进行 补全处理, 得到目标对话文本, 包括: 获取历史对话文本和所述历史对话文本对应的历史回复文本; 所述历史对话文本是指 所述当前对话文本上一轮对话的文本; 所述历史对话文本和所述历史回复文本均对应于同 一个历史文本标签; 对所述历史对话文本、 所述历史回复文本和所述当前对话文本进行文本拼接, 得到初 始文本; 获取所述当前对话文本对应的当前文本标签, 并对所述历史文本标签和所述当前文本 标签进行拼接, 得到初始标签; 将所述初始文本和所述初始标签输入至预设文本查询模型, 获取所述预设文本查询模 型输出的与初始文本对应的指代实体位置, 以及与当前对话文本对应的待补全位置; 从所述初始文本 中提取所述指代实体位置对应的指代实体文本, 并根据 所述指代实体 文本和所述待补全位置对所述当前对话文本进行文本补全, 得到目标对话文本 。 4.如权利要求1所述的查询文本排序方法, 其特征在于, 所述对所述目标对话文本进行 召回处理, 得到候选对话文本, 包括: 对所述目标对话文本进行文本检测, 得到文本检测结果; 所述文本检测结果中包括检 测失败结果; 所述检测失败结果表征 所述目标对话文本存在错 误; 对所述检测失败结果对应的所述目标对话文本进行纠正处 理, 得到纠正对话文本; 获取预设意图识别模型, 通过所述预设意图识别模型对所述纠正对话文本进行意图识 别, 得到文本意图识别结果; 获取待选对话文本集, 所述待选对话文本集包括至少一个待选对话文本; 将所述待选对话文本和所述文本意图识别结果进行语义相似度匹配, 得到语义相似度 匹配结果; 将所述语义相似度匹配结果大于或等于预设相似度阈值的待选对话文本确定为候选权 利 要 求 书 1/3 页 2 CN 115495553 A 2对话文本 。 5.如权利要求1所述的查询文本排序方法, 其特征在于, 所述获取所述候选文本向量对 应的候选语义向量, 包括: 通过所述预设文本模型中的注意力层对所述候选文本向量进行注意力处理, 得到注意 力向量; 将所有所述注意力向量输入至所述预设文本模型中的残差层, 获取所述残差层输出的 残差向量; 通过所述预设文本模型中的全连接层对所述残差向量进行线性映射处理, 得到所述候 选语义向量。 6.如权利要求1所述的查询文本排序方法, 其特征在于, 所述通过预设文本模型对所述 目标对话文本进行向量处 理之前, 包括: 获取样本训练数据集, 所述样本训练数据集包括至少一个文本训练数据; 一个所述文 本训练数据对应一个样本标签; 获取预设训练模型, 通过所述预设训练模型对所述文本训练数据进行向量转换, 得到 样本文本向量; 将所述样本文本向量输入到所述预设训练模型中, 获取所述样本文本向量对应的样本 语义向量, 并对所述样本语义向量进行 预测, 得到预测标签; 根据同一所述文本训练数据对应的所述样本标签以及所述预测标签, 确定所述文本训 练数据的预测损失值; 在所述预测损失值未达到预设的收敛条件时, 迭代更新所述预设训练模型中的初始参 数, 直至所述预测损失值达到所述收敛条件时, 将收敛之后的所述预设训练模型记录为预 设文本模型。 7.一种查询文本排序装置, 其特 征在于, 包括: 文本召回模块, 用于获取目标对话文本, 对所述目标对话文本进行召回处理, 得到候选 对话文本; 向量转换模块, 用于通过预设文本模型对所述目标对话文本进行向量处理, 得到目标 文本向量, 并自预设向量库中获取与所述 候选对话文本对应的候选文本向量; 语义向量模块, 用于将所述候选文本向量和所述目标文本向量输入至所述预设文本模 型中, 获取与所述候选文本 向量对应的候选语义向量, 以及与所述 目标文本 向量对应的目 标语义向量; 文本排序模块, 用于对所述候选语义向量和所述目标语义向量进行预测 处理, 得到预 测值, 并根据所述预测值对所述 候选对话文本进行排序处 理, 得到文本排序结果。 8.如权利要求7 所述的查询文本排序装置, 其特 征在于, 所述补全处 理模块, 包括: 切词单元, 用于获取初始对话文本, 对所述初始对话文本进行切词处理, 得到所述初始 对话文本中的至少一个待处 理字词; 实体识别单元, 用于对所述待处理字词进行实体识别, 得到与所述待处理字词相对应 的实体识别结果; 过滤单元, 用于根据与各待处理字词相对应的实体识别结果, 对所述初始对话文本进 行过滤, 得到当前对话文本;权 利 要 求 书 2/3 页 3 CN 115495553 A 3

.PDF文档 专利 查询文本排序方法、装置、计算机设备及存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 查询文本排序方法、装置、计算机设备及存储介质 第 1 页 专利 查询文本排序方法、装置、计算机设备及存储介质 第 2 页 专利 查询文本排序方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:43:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。