专利语音文本的处理方法和装置、存储介质和处理器

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210375489.5 (22)申请日 2022.04.11 (71)申请人阿里巴巴（中国）有限公司地址 311121 浙江省杭州市余杭区五常街道文一西路969号3幢5层5 54室 (72)发明人陈粮阳　马腾岳　李国荣　陈起进　徐晓舟　任卫军　 (74)专利代理机构北京博浩百睿知识产权代理有限责任公司 1 1134 专利代理师谢湘宁　李静茹 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/237(2020.01) G06F 16/33(2019.01) G06F 16/332(2019.01)G06F 16/903(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称语音文本的处理方法和装置、存储介质和处理器 (57)摘要本申请公开了一种语音文本的处理方法和装置、存储介质和处理器。其中，该方法包括：获取待处理的语音文本信息；获取目标算法模型，其中，所述目标算法模型由正则匹配模型、语义匹配模型和目标意图识别模型组成。通过所述目标算法模型对所述待处理的语音文本进行处理，得到目标语音文本信息。本申请解决了相关技术中在进行语音文本质检工作时，现有算法耗时过长，导致对语音文本的处理效率比较低的技术问题。权利要求书2页说明书16页附图5页 CN 114936561 A 2022.08.23 CN 114936561 A 1.一种语音文本的处理方法，其特征在于，包括：获取待处理的语音文本信息；获取目标算法模型，其中，所述目标算法模型由正则匹配模型、语义匹配模型和目标意图识别模型组成；通过所述目标算法模型对所述待处理的语音文本进行处理，得到目标语音文本信息。 2.根据权利要求1所述的方法，其特征在于，通过目标算法模型对所述待处理的语音文本进行处理，得到目标语音文本信息包括：将所述待处理的语音文本信息与所述正则匹配模型中的正则表达式进行匹配，得到第一语音文本信息；将所述待处理的语音文本信息与所述语义匹配模型中的标准语句库进行语义匹配，得到第二语音文本信息；通过所述目标意图识别模型对所述待处理的语音文本信息进行处理，得到第三语音文本信息；将所述第一语音文本信息、所述第二语音文本信息和所述第二语音文本信息作为所述目标语音文本信息。 3.根据权利要求2所述的方法，其特征在于，通过所述目标意图识别模型对所述待处理的语音文本信息进行处理，得到第三语音文本信息包括：通过所述目标意图识别模型对所述待处理的语音文本信息进行意图识别和槽位提取，得到所述待处理的语音文本信息对应的意图标签；将符合预设要求的意图标签对应的待处理的语音文本信息作为所述第三语音文本信息。 4.根据权利要求1所述的方法，其特征在于，在通过所述目标算法模型对所述待处理的语音文本进行处理，得到目标语音文本信息之后，所述方法还包括：对所述目标语音文本信息进行准确性核查，得到核查结果；依据所述核查结果，对所述目标算法模型进行迭代更新处理。 5.根据权利要求1所述的方法，其特征在于，获取目标算法模型包括：构建正则表达式，得到所述正则匹配模型；获取所述语义匹配模型，其中，所述语义匹配模型为基于SentenceBert的多任务学习模型；获取所述目标意图识别模型，其中，所述意图识别模型为基于JointB ert的多任务学习模型；将所述正则匹配模型，所述语义匹配模型和所述意图识别模型组建为所述目标算法模型。 6.根据权利要求5所述的方法，其特征在于，获取所述目标意图识别模型包括：基于JointBert的多任务学习模型进行模型构建，得到第一意图识别模型；获取训练样本，其中，所述训练样本用于训练所述第一意图识别模型；依据所述训练样本，采用不确定性采样的方式对所述第一意图识别模型进行预设次数的训练，在预设次数训练完成后得到第二意图识别模型；对所述第二意图识别模型进行优化，得到所述目标意图识别模型。权　利　要　求　书 1/2 页 2 CN 114936561 A 27.根据权利要求6所述的方法，其特征在于，对所述第二意图识别模型进行优化，得到所述目标意图识别模型包括：获取每次训练后得到的意图识别模型，并通过第一预设算法对所述每次训练得到的意图识别模型进行集成学习，得到第三意图识别模型；依据所述第三意图识别模型，通过第二预设算法对所述第二意图识别模型进行迁移学习，得到第四意图识别模型；通过第三预设算法对所述第四意图识别模型进行优化，得到第五意图识别模型；通过第四预设算法对所述第五意图识别模型的参数进行平滑处理，得到所述目标意图识别模型。 8.根据权利要求7所述的方法，其特征在于，通过第三预设算法对所述第四意图识别模型进行优化，得到第五意图识别模型包括：获取对抗样本，并将所述对抗样本输入所述第四意图识别模型，得到第一输出结果；将所述训练样本输入所述第四意图识别模型，得到第二输出结果；依据所述第一输出结果和所述第二输出结果，得到最大对称相对熵；将所述最大对称相对熵添加到所述第四意图识别模型的损失函数中，得到目标损失函数；依据所述目标损失函数，对所述第四意图识别模型进行优化，得到所述第五意图识别模型。 9.一种语音文本的处理方法，其特征在于，包括：接收客户端发送的待处理的语音文本信息；在云服务器中通过目标算法模型对所述待处理的语音文本进行处理，得到目标语音文本信息；将所述目标语音文本信息返回至所述客户端。 10.一种语音文本的处理装置，其特征在于，包括：第一获取单元，用于获取待处理的语音文本信息；第二获取单元，用于获取目标算法模型，其中，所述目标算法模型由正则匹配模型、语义匹配模型和目标意图识别模型组成；处理单元，用于通过所述目标算法模型对所述待处理的语音文本进行处理，得到目标语音文本信息。 11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求1至8 中任意一项所述的语音文本的处理方法。 12.一种处理器，其特征在于，所述处理器用于运行程序，其中，所述程序运行时执行权利要求1至8中任意一项所述的语音文本的处理方法。权　利　要　求　书 2/2 页 3 CN 114936561 A 3

专利 语音文本的处理方法和装置、存储介质和处理器

专利语音文本的处理方法和装置、存储介质和处理器