全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210375489.5 (22)申请日 2022.04.11 (71)申请人 阿里巴巴 (中国) 有限公司 地址 311121 浙江省杭州市余杭区五常街 道文一西路969号3幢5层5 54室 (72)发明人 陈粮阳 马腾岳 李国荣 陈起进  徐晓舟 任卫军  (74)专利代理 机构 北京博浩百 睿知识产权代理 有限责任公司 1 1134 专利代理师 谢湘宁 李静茹 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/237(2020.01) G06F 16/33(2019.01) G06F 16/332(2019.01)G06F 16/903(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 语音文本的处理方法和装置、 存储介质和处 理器 (57)摘要 本申请公开了一种语音文本的处理方法和 装置、 存储介质和处理器。 其中, 该方法包括: 获 取待处理的语音文本信息; 获取目标算法模型, 其中, 所述目标算法模型由正则匹配模型、 语义 匹配模型和目标意图识别模型 组成。 通过所述目 标算法模型对 所述待处理的语音文本进行处理, 得到目标语音文本信息。 本申请解决了相关技术 中在进行语音文本质检工作时, 现有算法耗时过 长, 导致对语音文本的处理效率比较低的技术问 题。 权利要求书2页 说明书16页 附图5页 CN 114936561 A 2022.08.23 CN 114936561 A 1.一种语音 文本的处 理方法, 其特 征在于, 包括: 获取待处 理的语音 文本信息; 获取目标算法模型, 其中, 所述目标算法模型由正则匹配模型、 语义匹配模型和目标意 图识别模型组成; 通过所述目标算法模型对所述待处 理的语音 文本进行处 理, 得到目标语音 文本信息 。 2.根据权利要求1所述的方法, 其特征在于, 通过目标算法模型对所述待处理 的语音文 本进行处 理, 得到目标语音 文本信息包括: 将所述待处理 的语音文本信 息与所述正则匹配模型中的正则表达 式进行匹配, 得到第 一语音文本信息; 将所述待处理 的语音文本信 息与所述语义匹配模型中的标准语句库进行语义匹配, 得 到第二语音 文本信息; 通过所述目标意图识别模型对所述待处理 的语音文本信 息进行处理, 得到第 三语音文 本信息; 将所述第一语音文本信 息、 所述第 二语音文本信 息和所述第 二语音文本信 息作为所述 目标语音 文本信息 。 3.根据权利要求2所述的方法, 其特征在于, 通过所述目标意图识别模型对所述待处理 的语音文本信息进行处 理, 得到第三语音 文本信息包括: 通过所述目标意图识别模型对所述待处理 的语音文本信 息进行意图识别和槽位提取, 得到所述待处 理的语音 文本信息对应的意图标签; 将符合预设要求的意图标签对应的待处理的语音文本信息作为所述第三语音文本信 息。 4.根据权利要求1所述的方法, 其特征在于, 在通过所述目标算法模型对所述待处理 的 语音文本进行处 理, 得到目标语音 文本信息之后, 所述方法还 包括: 对所述目标语音 文本信息进行准确性核查, 得到核查结果; 依据所述核查结果, 对所述目标算法模型进行迭代更新处 理。 5.根据权利要求1所述的方法, 其特 征在于, 获取目标算法模型包括: 构建正则表达式, 得到所述 正则匹配模型; 获取所述语义匹配模型, 其中, 所述语义匹配模型为基于SentenceBert的多任务学习 模型; 获取所述目标意图识别模型, 其 中, 所述意图识别模型为基于JointB ert的多任务学习 模型; 将所述正则匹配模型, 所述语义匹配模型和所述意图识别模型组建为所述目标算法模 型。 6.根据权利要求5所述的方法, 其特 征在于, 获取 所述目标意图识别模型包括: 基于JointBert的多任务学习模型进行模型构建, 得到第一 意图识别模型; 获取训练样本, 其中, 所述训练样本用于训练所述第一 意图识别模型; 依据所述训练样本, 采用不确定性采样的方式对所述第 一意图识别模型进行预设次数 的训练, 在预设次数训练完成后得到第二 意图识别模型; 对所述第二 意图识别模型进行优化, 得到所述目标意图识别模型。权 利 要 求 书 1/2 页 2 CN 114936561 A 27.根据权利要求6所述的方法, 其特征在于, 对所述第二意图识别模型进行优化, 得到 所述目标意图识别模型包括: 获取每次训练后得到的意图识别模型, 并通过第 一预设算法对所述每次训练得到的意 图识别模型进行集成学习, 得到第三 意图识别模型; 依据所述第 三意图识别模型, 通过第 二预设算法对所述第 二意图识别模型进行迁移学 习, 得到第四意图识别模型; 通过第三预设算法对所述第四意图识别模型进行优化, 得到第五意图识别模型; 通过第四预设算法对所述第五意图识别模型的参数进行平滑 处理, 得到所述目标意图 识别模型。 8.根据权利要求7所述的方法, 其特征在于, 通过第 三预设算法对所述第四意图识别模 型进行优化, 得到第五意图识别模型包括: 获取对抗样本, 并将所述对抗样本 输入所述第四意图识别模型, 得到第一输出 结果; 将所述训练样本 输入所述第四意图识别模型, 得到第二输出 结果; 依据所述第一输出 结果和所述第二输出 结果, 得到最大对称相对熵; 将所述最大对称相对熵添加到所述第四意图识别模型的损失函数中, 得到目标损失函 数; 依据所述目标损 失函数, 对所述第 四意图识别模型进行优化, 得到所述第五意图识别 模型。 9.一种语音 文本的处 理方法, 其特 征在于, 包括: 接收客户端发送的待处 理的语音 文本信息; 在云服务器中通过目标算法模型对所述待处理的语音文本进行处理, 得到目标语音文 本信息; 将所述目标语音 文本信息返回至所述 客户端。 10.一种语音 文本的处 理装置, 其特 征在于, 包括: 第一获取 单元, 用于获取待处 理的语音 文本信息; 第二获取单元, 用于获取目标算法模型, 其中, 所述目标算法模型由正则匹配模型、 语 义匹配模型和目标意图识别模型组成; 处理单元, 用于通过所述目标算法模型对所述待处理的语音文本进行处理, 得到目标 语音文本信息 。 11.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的程 序, 其中, 在所述程序运行时控制所述存储介质所在设备执行权利要求1至8 中任意一项所 述的语音 文本的处 理方法。 12.一种处理器, 其特征在于, 所述处理器用于运行程序, 其中, 所述程序运行时执行权 利要求1至8中任意 一项所述的语音 文本的处 理方法。权 利 要 求 书 2/2 页 3 CN 114936561 A 3

.PDF文档 专利 语音文本的处理方法和装置、存储介质和处理器

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 语音文本的处理方法和装置、存储介质和处理器 第 1 页 专利 语音文本的处理方法和装置、存储介质和处理器 第 2 页 专利 语音文本的处理方法和装置、存储介质和处理器 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:52:35上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。