全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211013807.X (22)申请日 2022.08.23 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 谢汉垒 钱兵 马冲 刘珮  薛艳茹  (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 专利代理师 王辉 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/332(2019.01) (54)发明名称 基于提示学习的意图识别方法、 问答方法及 装置 (57)摘要 本公开提供了一种基于提示学习的意图识 别方法、 问答方法及装置, 属于自然语言处理技 术领域。 该方法对接收到的第一查询文本进行重 构, 根据提示学习范式添加第一提示文本获得第 二查询文本, 并将其输入预训练语言模型中, 以 使预训练语言模型就第一提示文本对第一查询 本文预测的第一预测意图, 其中, 提示学习范式 用于提供第一提示文本, 以提示预训练语言模型 预测第一查询文本表示的查询意图。 此时, 无需 对第一查询文本进行分词处理, 避免了分词对知 识结构的破坏, 能够更充分地利用预训练语言模 型的信息, 提高分类准确率; 采用重构的第一查 询文本, 将下游分类任务转换成预测任务, 提高 预训练语言模 型与下游任务的适配度, 进而提高 了意图识别准确率。 权利要求书2页 说明书14页 附图7页 CN 115391527 A 2022.11.25 CN 115391527 A 1.一种基于提 示学习的意图识别方法, 其特 征在于, 所述方法包括: 接收第一 查询文本; 根据提示学习范式在所述第一查询文本中添加第一提示文本, 获得第二查询文本, 所 述提示学习范式用于提供至少一种第一提示文本, 所述第一提示文本用于提示预训练语言 模型对所述第一 查询文本表示的查询意图进行 预测; 将所述第二查询文本输入所述预训练语言模型中, 以获取所述预训练语言模型基于所 述第一提示文本对所述第一 查询文本 输出的所述第一预测意图。 2.根据权利要求1所述的方法, 其特征在于, 所述接收第一查询文本之前, 所述方法还 包括: 获取第三 查询文本, 以及所述第二 查询文本对应的实际意图; 根据所述第 三查询文本与 所述实际意图间的关联关系确定所述提示学习范式, 并根据 所述提示学习范式在所述第三 查询文本中添加第二 提示文本, 获得第四查询文本; 将所述第四查询文本输入所述预训练语言模型中, 以获取所述预训练语言模型基于所 述第二提示文本对所述第四查询文本 输出的所述第二预测意图; 调整所述 提示学习范式, 以使所述实际意图与所述第二预测意图满足分类目标。 3.根据权利要求1所述的方法, 其特征在于, 所述根据提示学习范式在所述第 一查询文 本中添加第一 提示文本, 获得第二 查询文本, 包括: 根据所述 提示学习范式获取 所述第一 查询文本对应的所述触发词; 在所述第一查询文本中添加触发词和掩码, 获得所述第二查询文本, 所述触发词用于 提示所述预训练语言模型对所述第一查询文本的所述查询意图进 行预测, 所述掩码用于指 代所述第一 查询文本的所述 查询意图。 4.根据权利要求3所述的方法, 其特征在于, 所述将所述第 二查询文本输入所述预训练 语言模型中, 以获取所述预训练语言模型基于所述第一提示文本对所述第一查询文本输出 的所述第一预测意图, 包括: 将所述第二查询文本输入所述预训练语言模型中, 以使所述预训练语言模型在所述触 发词的提示下, 基于所述第一查询文本对所述掩码进行预测, 获得所述第一查询文本的所 述第一预测意图。 5.根据权利要求3所述的方法, 其特征在于, 所述在所述第 一查询文本中添加触发词和 掩码, 获得 所述第二 查询文本, 包括: 在所述查询文本 中添加所述触发词和所述掩码, 以及所述触发词对应的至少两个分类 项, 获得所述第二 查询文本 。 6.根据权利要求5所述的方法, 其特征在于, 所述将所述第 二查询文本输入所述预训练 语言模型中, 以获取所述预训练语言模型基于所述第一提示文本对所述第一查询文本输出 的所述第一预测意图, 包括: 将所述第二查询文本输入所述预训练语言模型中, 以使所述预训练语言模型在所述触 发词的提示下, 基于所述第一查询文本在所述分类项中对所述掩码进行预测, 获得所述第 一查询文本的所述第一预测意图。 7.根据权利要求1所述的方法, 其特征在于, 所述将所述第 二查询文本输入所述预训练 语言模型中, 以获取所述预训练语言模型基于所述提示文本对所述查询文本的预测 意图,权 利 要 求 书 1/2 页 2 CN 115391527 A 2包括: 将所述第二查询文本输入所述预训练语言模型中, 以获取所述预训练语言模型基于所 述第一提示文本对所述第一 查询文本 输出的预测值; 根据所述预测值在映射表中确定所述第 一查询文本对应的第 一预测意图, 所述映射表 定义预测意图与预测值的映射关系, 每一所述预测意图对应至少一个所述预测值。 8.一种问答方法, 其特 征在于, 所述方法包括: 接收第一查询文本, 并获取所述第一查询文本对应的第一预测意图, 所述第一预测意 图采用权利要求1至7任一所述的基于提 示学习的意图识别方法得到; 基于所述第一预测意图对所述第一 查询文本进行命名实体识别; 在知识图谱中根据所述第 一预测意图、 所述命名实体获取所述第 一查询文本对应的答 案文本。 9.一种基于提 示学习的意图识别装置, 其特 征在于, 所述装置包括: 文本接收模块, 用于 接收第一 查询文本; 文本构建模块, 用于根据提示学习范式在所述第一查询文本中添加第一提示文本, 获 得第二查询文本, 所述提示学习 范式用于提供至少一种第一提示文本, 所述第一提示文本 用于提示预训练语言模型对所述第一 查询文本表示的查询意图进行 预测; 分类预测模块, 用于将所述第二查询文本输入所述预训练语言模型中, 以获取所述预 训练语言模型基于所述第一 提示文本对所述第一 查询文本 输出的所述第一预测意图。 10.一种问答装置, 其特 征在于, 所述装置包括: 文本分类模块, 用于接收第一查询文本, 并获取所述第一查询文本对应的第一预测意 图, 所述第一预测意图采用权利要求9所述的基于提 示学习的意图识别装置得到; 实体识别模块, 用于基于所述第一预测意图对所述第一 查询文本进行命名实体识别; 答案查询模块, 用于在知识图谱中根据所述第一预测意图、 所述命名实体获取所述第 一查询文本对应的答案文本 。 11.一种电子设备, 其特征在于, 包括处理器, 存储器及存储在所述存储器上并可在所 述处理器上运行的程序或指 令, 所述程序或指 令被所述处理器执行时实现如权利要求 1至7 中任一项所述的基于提 示学习的意图识别方法, 或权利要求8所述的问答方法。 12.一种可读存储介质, 其特征在于, 所述可读存储介质上存储程序或指令, 所述程序 或指令被处理器执行时实现如权利要求1至7中任一项所述的基于提示学习的意图识别方 法, 或权利要求8所述的问答方法。权 利 要 求 书 2/2 页 3 CN 115391527 A 3

.PDF文档 专利 基于提示学习的意图识别方法、问答方法及装置

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于提示学习的意图识别方法、问答方法及装置 第 1 页 专利 基于提示学习的意图识别方法、问答方法及装置 第 2 页 专利 基于提示学习的意图识别方法、问答方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:14:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。