全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210922664.8 (22)申请日 2022.08.02 (71)申请人 鼎富智能科技有限公司 地址 230000 安徽省合肥市高新区习友路 3333号A1楼19层-B区 (72)发明人 李健铨 穆晶晶 刘小康 胡加明  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 唐正瑜 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/242(2020.01) G06F 17/16(2006.01) G06N 3/04(2006.01) G06N 5/04(2006.01)G06N 7/00(2006.01) (54)发明名称 语义槽识别方法、 装置、 电子设备及计算机 可读存储介质 (57)摘要 本申请提供一种语义槽识别方法、 装置、 电 子设备及计算机可读存储介质, 属于语义识别领 域。 该语义槽识别方法, 包括: 获取待处理语料和 转移权重四阶张量; 通过预设的语义槽识别模型 处理转移权重四阶张量、 预先获取的起始状态向 量、 预先获取的终止状态向量, 得到待处理语料 中每个词语各自对应的前向分数和后向分数; 针 对待处理语料中的每个词语, 通过预设的语义槽 识别模型处理该词语的前向分数、 后向分数、 转 移权重四阶张量, 得到该词语的标签得分; 通过 预设的语义槽识别模型处理标签得分, 得到该词 语与每个预设标签对应的标签分数, 将大于预设 阈值的标签分数对应的标签作为该词语的标签, 并输出待处 理语料中每 个词语的标签 。 权利要求书3页 说明书18页 附图2页 CN 115510870 A 2022.12.23 CN 115510870 A 1.一种语义槽识别方法, 其特 征在于, 包括: 获取待处理语料和转移权重四阶张量, 所述待处理语料为多个词语组成的词语集合, 所述转移权重四阶张量表征 预设词表中任意两个词语之间的状态转移权 重; 通过预设的语义槽识别模型处理所述待处理语料和所述转移权重四阶张量, 得到所述 待处理语料中每 个词语的标签, 包括: 通过预设的语义槽识别模型处理所述转移权重四阶张量、 预先获取的表征各个预设起 始状态的权重的起始状态向量、 预先获取的表征各个预设终止状态的权重的终止状态向 量, 得到所述待处 理语料中每 个词语各自对应的前向分数和后向分数; 针对所述待处理语料中的每个词语, 处理该词语的后向分数、 所述转移权重四阶张量 以及该词语的前一个词语的前向分数, 得到该词语的标签得分; 处理所述标签得分, 得到该词语与每个预设标签对应的标签分数, 将大于预设阈值的 标签分数对应的标签作为该词语的标签, 并输出 所述待处 理语料中每 个词语的标签。 2.根据权利要求1所述的方法, 其特 征在于, 所述获取 所述转移权重四阶张量, 包括: 获取预设的训练语料集对应的规则表达 式集, 所述规则表达 式集包括所述训练语料集 中, 每一个训练语料对应的规则表达式, 每一个训练语料对应的规则表达式表征该训练语 料中不同词组之间的位置关系; 基于所述训练语料集和所述规则表达式集, 得到输入词表、 输出词表、 有限状态集合、 有限起始状态集合、 有限终止状态集合, 所述输入词表包括所述训练语料集中的所有词语, 所述输出词表包括所述规则表达式集中的所有类型的标签, 所述有限状态集合包括所述规 则表达式集中的所有转移状态, 有限起始状态集合包括所述规则表达式集中的所有起始状 态, 有限终止状态集 合包括所述 规则表达式集中的所有终止状态; 基于所述输入词表、 所述输出词表、 所述有限状态集合、 所述有限起始状态集合、 所述 有限终止状态集 合, 得到所述 转移权重四阶张量。 3.根据权利要求2所述的方法, 其特征在于, 所述通过预设的语义槽识别模型处理所述 转移权重四阶张量、 预先获取 的表征各个预设起始状态的权重的起始状态向量、 预先获取 的表征各个预设终止状态的权重的终止状态向量, 得到所述待处理语料中每个词语各自对 应的前向分数和后向分数, 包括: 针对所述待处理语料中的每个词语, 通过所述预设的语义槽识别模型处理所述转移权 重四阶张量, 确定该词语的转移权重矩阵, 所述转移权重矩阵表征该词语与所述预设词表 中任意一个词语之间的状态转移权 重; 处理所述起始状态向量、 所述 转移权重矩阵, 得到该词语对应的前向分数; 处理所述终止状态向量、 所述 转移权重矩阵, 得到该词语对应的后向分数。 4.根据权利要求2所述的方法, 其特征在于, 所述规则表达 式中不同标签之间的转移状 态不同。 5.根据权利要求4所述的方法, 其特征在于, 所述通过预设的语义槽识别模型处理所述 转移权重四阶张量、 预先获取 的表征各个预设起始状态的权重的起始状态向量、 预先获取 的表征各个预设终止状态的权重的终止状态向量, 得到所述待处理语料中每个词语各自对 应的前向分数和后向分数, 包括: 通过所述预设的语义槽识别模型处理所述转移权重四阶张量, 得到转移权重三阶张量权 利 要 求 书 1/3 页 2 CN 115510870 A 2和映射矩阵, 所述转移权重三阶张量和所述映射矩阵的乘积为所述转移权重四阶张量, 所 述转移权重三阶张量表征预设词表中任意一个词语对应的所有状态转换, 所述映射矩阵表 征所述终止状态到 输出标签的映射关系, 所述输出 标签为所述预设标签中的任意 一种; 对所述转移权重三阶张量进行张量秩分解, 得到第一矩阵、 第二矩阵、 第三矩阵; 处理所述第 一矩阵、 所述第 二矩阵、 所述第三矩阵、 表征各个起始状态权重的起始状态 向量和所述映射矩阵, 得到所述待处 理语料中每 个词语各自对应的前向分数; 处理所述第 一矩阵、 所述第 二矩阵、 所述第三矩阵、 表征各个起始状态权重的起始状态 向量和所述映射矩阵, 得到所述待处 理语料中每 个词语各自对应的后向分数。 6.根据权利要求5所述的方法, 其特征在于, 所述处理所述第 一矩阵、 所述第 二矩阵、 所 述第三矩阵、 表征各个起始状态权重的起始状态向量和所述映射矩阵, 得到所述待处理语 料中每个词语各自对应的前向分数, 包括: 处理所述第 一矩阵、 所述第 二矩阵、 所述第三矩阵、 表征各个起始状态权重的起始状态 向量、 所述映射矩阵 以及预设的更新门数据、 预设的重置门数据, 得到所述待处理语料中每 个词语各自对应的前向分数; 相应的, 所述处理所述第一矩阵、 所述第二矩阵、 所述第三矩阵、 表征各个起始状态权 重的起始状态向量和所述映射矩阵, 得到所述待处理语料中每个词语各自对应的后向分 数, 包括: 处理所述第 一矩阵、 所述第 二矩阵、 所述第三矩阵、 表征各个起始状态权重的起始状态 向量、 所述映射矩阵 以及所述预设的更新门数据、 所述预设的重置门数据, 得到所述待处理 语料中每 个词语各自对应的后向分数。 7.根据权利要求5所述的方法, 其特征在于, 所述处理所述第 一矩阵、 所述第 二矩阵、 所 述第三矩阵、 表征各个起始状态权重的起始状态向量和所述映射矩阵, 得到所述待处理语 料中每个词语各自对应的前向分数, 包括: 处理预设的状态矩阵和所述第二矩阵, 得到目标状态矩阵, 所述状态矩阵表征多个预 设的虚拟转移状态; 处理所述第一矩阵、 所述第三矩阵、 所述起始状态向量、 所述映射矩阵、 所述目标状态 矩阵, 得到所述待处 理语料中每 个词语各自对应的前向分数; 相应的, 处理所述第一矩阵、 所述第二矩阵、 所述第三矩阵、 表征各个起始状态权重的 起始状态向量和所述映射矩阵, 得到所述待处理语料中每个词语各自对应的后向分数, 包 括: 处理预设的状态矩阵和所述第二矩阵, 得到目标状态矩阵, 所述状态矩阵表征多个预 设的虚拟转移状态; 处理所述第 一矩阵、 所述第 三矩阵、 表征各个起始状态权重的起始状态向量、 所述映射 矩阵、 所述目标状态 矩阵, 得到所述待处 理语料中每 个词语各自对应的后向分数。 8.一种语义槽识别装置, 其特 征在于, 包括: 获取模块, 用于获取待处理语料和转移权重四阶张量, 所述待处理语料为多个词语组 成的词语集合, 所述转移权重四阶张量表征预设词表中任意两个词语之间的状态转移权 重; 处理模块, 用于通过预设的语义槽识别模型处理所述待处理语料和所述转移权重四阶权 利 要 求 书 2/3 页 3 CN 115510870 A 3

PDF文档 专利 语义槽识别方法、装置、电子设备及计算机可读存储介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 语义槽识别方法、装置、电子设备及计算机可读存储介质 第 1 页 专利 语义槽识别方法、装置、电子设备及计算机可读存储介质 第 2 页 专利 语义槽识别方法、装置、电子设备及计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。