全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211212765.2 (22)申请日 2022.09.30 (71)申请人 太保科技有限公司 地址 200010 上海市黄浦区中山 南路1号1 1 层(名义楼层)1 1V6室 (72)发明人 张士杰  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 曹伟 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/36(2019.01) (54)发明名称 一种问句生成的方法、 系统及存 储介质 (57)摘要 本申请公开了一种问句生 成的方法、 系统及 存储介质。 该方法基于知识信息, 利用问句生成 模型生成问句。 基于问句生成模型生成的问句, 通过判别系统获得判别结果及问句知识信息对, 通过判别系统对判别结果运算, 获得目标奖励。 然后所述判别系统将问句知识信息对和目标奖 励返回给问句生成模型; 以返回给所述问句生成 模型中的问句知识信息对中对应的目标奖励符 合预设要求的问句知识信息对作为训练数据, 基 于所述训练数据, 通过 强化学习的方式对问句生 成模型进行训练, 对问句生 成模型进行更新以生 成新的问句。 在本申请中还公开了一种问句生成 的系统及存储介质。 在本申请实施例中, 实现了 问句的生成。 权利要求书2页 说明书11页 附图3页 CN 115510205 A 2022.12.23 CN 115510205 A 1.一种问句生成的方法, 其特 征在于, 所述方法包括: 基于知识信息, 利用问句生成模型生成问句; 基于所述问句生成模型生成的问句, 通过判别系统获得判别结果及问句知识信息对; 通过所述判别系统对所述判别结果 运算, 获得目标 奖励; 所述判别系统将所述问句知识信息对和所述目标 奖励返回给问句生成模型; 以返回给所述问句生成模型中的问句知识信息对中对应的目标奖励符合预设要求的 问句知识信息对作为训练数据; 基于所述训练数据, 通过强化学习的方式对问句生成模型进行训练, 对问句生成模型 进行更新; 以更新后的问句生成模型生成新的问句。 2.根据权利要求1所述的方法, 其特 征在于, 所述判别系统包括: 问答系统、 知识库信息 ‑问句相似度模型和语法正 误判断模型; 所述基于所述问句生成模型生成的问句, 通过 所述判别系统获得判别结果, 具体包括: 知识库信 息‑问句相似度模型通过判断输入所述问句生成模型的知识信 息与所述基于 问句生成模型生成的问句之间的相似度, 获得第一奖励; 语法正误判断模型通过判断输入的问句的语法是否正确, 获得第二奖励; 问答系统查询所述问句生成模型生成的问句对应的答案, 通过判断所述答案与知识信 息是否匹配, 获得第三奖励; 所述通过所述判别系统对所述判别结果 运算, 获得目标 奖励, 具体包括: 根据所述第一奖励、 所述第二奖励和所述第三奖励获得目标 奖励。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述第一奖励、 所述第二奖励和 所述第三奖励获得目标 奖励包括: 根据所述第一奖励、 所述第二奖励和所述第三奖励计算加权平均值, 将所述加权平均 值作为所述目标 奖励。 4.根据权利要求1所述的方法, 其特 征在于, 所述知识信 息存储于所述问答系统的知识库内, 所述知识信 息为具有头尾实体且实体 间存在确定的联系的一组信息 。 5.根据权利要求1所述的方法, 其特 征在于, 所述问句包括: 所述答案与所述知识信息匹配的问句, 或, 所述 答案与所述知识信息不匹配的问句。 6.根据权利要求1所述的方法, 其特征在于, 所述符合预设要求的问句知识信息对, 包 括: 对应的目标 奖励为所述目标 奖励的取值范围内的最大值。 7.一种问句生成的系统, 其特 征在于, 包括: 问句生成模型和判别系统, 其中判别系统包括问答系统, 问答系统包括知识库; 所述问句生成模型, 用于基于知识信息, 利用问句生成模型生成问句: 所述问答系统, 用于从所述问句生成模型获取问句, 所述问答系统隶属于判别系统; 所述判别系统, 用于基于问句生成模型生成的问句 获得判别结果, 对所述判别结果运 算获得目标奖励, 并生成问句知识信息对, 将所述问句知识信息对和所述 目标奖励返回给 问句生成模型; 其中, 返回给所述问句生成模型中的问句知识信息对中对应的目标奖励符权 利 要 求 书 1/2 页 2 CN 115510205 A 2合预设要求的问句知识信息对作为训练数据; 所述问句生成模型, 还用于基于所述训练数据, 通过强化学习的方式训练并更新; 以更 新后的问句生成模型生成新的问句。 8.根据权利要求7 所述的系统, 其特 征在于, 所述判别系统还 包括: 知识库信息 ‑问句相似度模型和语法正 误判断模型; 所述知识库信息 ‑问句相似度模型, 用于通过判断输入所述问句生成模型的知识信息 与所述基于问句生成模型生成的问句之间的相似度, 获得第一奖励; 所述语法正 误判断模型, 用于通过判断输入的问句的语法是否正确, 获得第二奖励; 所述问答系统, 用于查询所述问句生成模型生成的问句对应的答案, 通过判断所述答 案与知识信息是否匹配, 获得第三奖励; 所述判别系统, 具体用于: 根据所述第一奖励、 所述第二奖励和所述第三奖励获得目标 奖励。 9.根据权利要求8所述的系统, 其特 征在于, 所述判别系统具体用于: 根据所述第一奖励、 所述第二奖励和所述第三奖励的加权平均值, 将所述加权平均值 作为所述目标 奖励。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有问句生 成的实现程序, 所述问句生成的实现程序被处理器执行时实现如权利要求1 ‑6任意一项所 述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115510205 A 3

.PDF文档 专利 一种问句生成的方法、系统及存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种问句生成的方法、系统及存储介质 第 1 页 专利 一种问句生成的方法、系统及存储介质 第 2 页 专利 一种问句生成的方法、系统及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:41:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。