全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210908854.4 (22)申请日 2022.07.29 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 瞿晓阳 王健宗 陈劲钢  (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 专利代理师 麦广林 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/216(2020.01) G06F 40/30(2020.01)G06K 9/62(2022.01) (54)发明名称 文本生成方法、 电子设备及计算机可读存储 介质 (57)摘要 本发明公开了一种文本生 成方法、 电子设备 及计算机可读存储介质, 文本生成方法包括: 获 取目标主题词集合, 并根据目标主题词集合从预 设的文档库中筛选得到目标文档集合; 从目标文 档集合中提取得到关键词集合, 并根据目标主题 词集合和关键词集合得到关键词相似度; 根据关 键词相似度从关键词集合中筛选出目标关键词 集合, 其中, 目标关键词集合包括多个目标关键 词; 对目标关键词集合中的目标关键词进行聚类 处理, 得到初始目标段落集合; 对初始目标段落 集合进行段落内文本补充处理, 得到最终目标段 落集合; 对最终目标段落集合进行排序和组合处 理, 得到目标文本。 提高文本生成的速度及生成 后文本的整体质量。 权利要求书2页 说明书11页 附图5页 CN 115238039 A 2022.10.25 CN 115238039 A 1.一种文本生成方法, 其特 征在于, 包括: 获取目标主题词集合, 并根据 所述目标主题词集合从预设的文档库中筛选得到目标文 档集合; 从所述目标文档集合中提取得到关键词集合, 并根据所述目标主题词集合和所述关键 词集合得到关键词相似度; 根据所述关键词相似度从所述关键词集合中筛选出目标关键词集合, 其中, 所述目标 关键词集 合包括多个目标关键词; 对所述目标关键词集 合中的所述目标关键词进行聚类处 理, 得到初始目标 段落集合; 对所述初始目标 段落集合进行段落内文本补充处 理, 得到最终目标 段落集合; 对所述最终目标 段落集合进行排序和组合处 理, 得到目标文本 。 2.根据权利要求1所述的文本生成方法, 其特征在于, 所述根据 所述目标主题词集合从 预设的文档库中筛 选得到目标文档集 合, 包括: 根据所述目标主题词集 合从所述预设的文档库中索引得到多个相关文档; 根据所述目标主题词集 合和所述多个相关文档计算得到文档相似度; 根据所述文档相似度对所述多个相关文档进行排序并筛 选得到所述目标文档集 合。 3.根据权利要求1所述的文本生成方法, 其特征在于, 当所述段落内文本补充处理为抽 取式文本补充处理, 所述对所述初始目标段落集合进行段落内文本补充处理, 得到最终目 标段落集合, 包括: 提取所述目标文档集 合中的多条关键句, 得到关键句集 合; 根据所述关键句集合和一个所述初始目标段落内的多个所述目标关键词得到关键句 相似度; 根据所述关键句相似度对所述关键句集合进行排序处理, 得到一条所述关键句作为段 落中心句; 根据所述段落中心句从所述关键句集 合中的其 他所述关键句中筛 选出若干条相关句; 对所述段落中心句和所述若干条相关句进行排序处理并组合, 得到一个所述最终 目标 段落。 4.根据权利要求3所述的文本生成方法, 其特征在于, 所述根据 所述段落中心句从所述 关键句集 合中的其 他所述关键句中筛 选出若干条相关句, 包括: 将所述段落中心句输入预设的第 一生成模型, 以使所述第 一生成模型输出第 一主题概 率向量; 将所述关键句集合中的其他所述关键句输入预设的第 一生成模型, 以使所述第 一生成 模型输出第二主题概 率向量; 根据所述第一主题概 率向量和所述第二主题概 率向量得到主题相似度; 根据所述主题相似度从所述关键句集合中的其他所述关键句中筛选出若干条所述相 关句。 5.根据权利要求1所述的文本生成方法, 其特征在于, 当所述段落内补充处理为生成式 文本补充处理, 所述对所述初始目标段落集合进行段落内文本补充处理, 得到最终目标段 落集合, 包括: 将一个所述初始目标 段落内的多个所述目标关键词转换为多个第一词向量;权 利 要 求 书 1/2 页 2 CN 115238039 A 2根据所述多个第 一词向量计算得到平均词向量, 并将所述平均词向量输入预设的第 二 生成模型, 以使所述第二 生成模型生成一个文本序列; 对所述文本序列进行排序组合处 理, 得到一个所述 最终目标 段落。 6.根据权利要求1所述的文本生成方法, 其特 征在于, 包括: 所述对所述初始目标段落集合进行段落内文本补充处理, 包括: 获取相关常识集合并 根据所述相关 常识集合对所述初始目标 段落集合进行段落内文本补充处 理。 7.根据权利要求6所述的文本生成方法, 其特 征在于, 还 包括: 所述对所述最终目标段落集合进行排序和 组合处理, 包括: 获取相关常识集合并根据 所述相关 常识集合对所述 最终目标 段落集合进行排序和组合处 理。 8.根据权利要求1所述的文本生成方法, 其特征在于, 所述根据 所述目标主题词集合和 关键词集 合得到关键词相似度, 包括: 将所述目标主题词集合中的每个所述目标主题词转换为第 二词向量, 将每个所述关键 词转换为第三词向量; 将所述第二词向量和所述第 三词向量输入预设的第 三生成模型, 以使所述第 三生成模 型计算得到所述关键词相似度。 9.一种电子设备, 其特征在于, 包括: 存储器、 处理器及存储在存储器上并可在处理器 上运行的计算机程序, 所述处理器运行所述计算机程序时执行权利要求 1至8中任意一项 所 述的文本生成方法。 10.一种计算机可读存储介质, 其特征在于, 存储有计算机可执行指令, 所述计算机可 执行指令用于执 行所述计算机程序时实现如权利要求1至8任意 一项所述的文本生成方法。权 利 要 求 书 2/2 页 3 CN 115238039 A 3

PDF文档 专利 文本生成方法、电子设备及计算机可读存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本生成方法、电子设备及计算机可读存储介质 第 1 页 专利 文本生成方法、电子设备及计算机可读存储介质 第 2 页 专利 文本生成方法、电子设备及计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:24上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。