说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111655993.2 (22)申请日 2021.12.3 0 (71)申请人 科大讯飞 (苏州) 科技有限公司 地址 215021 江苏省苏州市工业园区金鸡 湖大道88号E4单元 申请人 合肥量圳建 筑科技有限公司 (72)发明人 郑新 李直旭 陈志刚  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 李文清 (51)Int.Cl. G06F 40/151(2020.01) G06F 40/205(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 逻辑语句生成方法、 装置、 电子设备及存储 介质 (57)摘要 本发明提供一种逻辑语句生成方法、 装置、 电子设备及存储介质, 首先获取自然语言文本, 并抽取自然语 言文本的各三元 组; 各三元组均包 括主语、 谓语以及宾语中至少一个元素, 各三元 组中各元素均基于自然语言文本确定; 然后对各 三元组进行序列标注, 确定各三元组之间的逻辑 信息; 最后基于各三元组以及逻辑信息, 确定自 然语言文本对应的逻辑语句。 该方法可以自动生 成自然语言文本对应的逻辑语句, 整个过程不需 要人工介入, 可以降低生成逻辑语句的人力成 本, 缩短生成逻辑语句所需的时长。 而且, 该方法 同样适用于对更新后的自然语言文本。 此外, 生 成的逻辑语句可以应用于知识图谱的构建, 便于 开展大量下游实际应用任务。 权利要求书2页 说明书17页 附图4页 CN 114462359 A 2022.05.10 CN 114462359 A 1.一种逻辑语句生成方法, 其特 征在于, 包括: 获取自然语言文本, 并抽取所述自然语言文本的各三元组; 所述各三元组均包括主语、 谓语以及宾语中至少一个元 素, 所述各三元组中各 元素均基于所述自然语言文本确定; 对所述各三元组进行序列标注, 确定所述各三元组之间的逻辑信息; 基于所述各三元组以及所述逻辑信息, 确定所述自然语言文本对应的逻辑语句。 2.根据权利要求1所述的语句生成方法, 其特征在于, 所述抽取所述自然语言文本的各 三元组, 包括: 对所述自然语言文本进行要素识别, 确定所述自然语言文本的要素 标签; 基于所述要素标签, 对所述自然语言文本中的三元组进行迭代抽取, 确定所述各三元 组。 3.根据权利要求2所述的语句生成方法, 其特征在于, 所述各三元组均基于对应的三元 组标签进行表征; 相应地, 所述基于所述要素标签, 对所述自然语言文本 中的三元组进行迭代抽取, 确定 所述各三元组, 包括: 对于当前迭代轮次, 将所述自然语言文本作为三元组抽取模型的第一输入、 所述当前 迭代轮次的前一迭代轮次对应的三元组标签作为所述三元组抽取模型的第二输入, 由所述 三元组抽取模型抽取所述当前迭代轮次对应的三元组标签; 其中, 所述第二输入的初始输 入为所述要素 标签; 若所述当前迭代轮次对应的三元组标签与 所述前一迭代轮次对应的三元组标签一致, 则迭代抽取动作结束; 否则, 将所述当前迭代轮次的下一迭代轮次作为所述当前迭代轮次, 继续由所述三元 组抽取模型抽取所述当前迭代轮次对应的三元组标签, 直至所述当前迭代轮次对应的三元 组标签与所述前一迭代轮次对应的三元组标签一 致。 4.根据权利要求3所述的逻辑语句生成方法, 其特征在于, 所述各三元组包含有不同粒 度的三元组; 所述基于所述各三元组以及所述逻辑信息, 确定所述自然语言文本对应的逻辑语句, 包括: 若不同粒度的三元组中存在第 一三元组和第 二三元组, 且所述第 一三元组中包含有所 述第二三元组, 则基于除所述第二三元组外的其他三元组以及所述其他三元组之 间的逻辑 信息, 确定所述逻辑语句。 5.根据权利要求1所述的逻辑语句生成方法, 其特征在于, 所述三元组 的类型包括缺失 元素三元组; 相应地, 所述基于所述各三元组以及所述逻辑信息, 确定所述自然语言文本对应的逻 辑语句, 之前包括: 基于所述缺失元素三元组以及所述自然语言文本, 确定所述缺失元素三元组中的缺失 元素及其在所述自然语言文本中的位置信息; 基于所述 位置信息, 将所述 缺失元素添加至所述 缺失元素三元组内。 6.根据权利要求1 ‑5中任一项所述的逻辑语句生成方法, 其特征在于, 所述逻辑信 息包 括逻辑连接词以及所述自然语言文本的语气等级信息;权 利 要 求 书 1/2 页 2 CN 114462359 A 2相应地, 所述基于所述各三元组以及所述逻辑信息, 确定所述自然语言文本对应的逻 辑语句, 包括: 将所述逻辑连接词、 用于表征所述三元组 的三元组标签以及所述语气等级信 息进行拼 接, 得到所述逻辑语句。 7.根据权利要求1 ‑5中任一项所述的逻辑语句生成方法, 其特征在于, 所述基于所述各 三元组以及所述逻辑信息, 确定所述自然语言文本对应的逻辑语句, 之后还 包括: 基于所述各三元组中各元素以及所述逻辑语句, 确定所述自然语言文本对应的结构化 自然语言语句。 8.一种逻辑语句生成装置, 其特 征在于, 包括: 三元组抽取模块, 用于获取自然语言文本, 并抽取所述自然语言文本的各三元组; 所述 各三元组均包括主语、 谓语以及宾语中至少一个元素, 所述各三元组中各元素均基于所述 自然语言文本确定; 逻辑信息确定模块, 用于对所述各三元组进行序列标注, 确定所述各三元组之间的逻 辑信息; 逻辑语句生成模块, 用于基于所述各三元组以及所述逻辑信息, 确定所述自然语言文 本对应的逻辑语句。 9.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至7任一项所 述逻辑语句生成方法的步骤。 10.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算 机程序被处 理器执行时实现如权利要求1至7任一项所述逻辑语句生成方法的步骤。权 利 要 求 书 2/2 页 3 CN 114462359 A 3

.PDF文档 专利 逻辑语句生成方法、装置、电子设备及存储介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 逻辑语句生成方法、装置、电子设备及存储介质 第 1 页 专利 逻辑语句生成方法、装置、电子设备及存储介质 第 2 页 专利 逻辑语句生成方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:52:00上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。