全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221091693 0.6 (22)申请日 2022.08.01 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 申请人 工银科技有限公司 (72)发明人 秦行  (74)专利代理 机构 北京康信知识产权代理有限 责任公司 1 1240 专利代理师 周春枚 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01)G06F 40/247(2020.01) (54)发明名称 信息处理方法、 装置、 计算机可读存储介质 及电子设备 (57)摘要 本发明公开了一种信息处理方法、 装置、 计 算机可读存储介质及电子设备。 涉及人工智能领 域, 该方法包括: 获取目标对象请求问答的请求 信息, 其中, 请求信息至少包括问答内容; 从多个 语料库中确定与问答内容对应的至少一个目标 语料, 其中, 目标语料包括第一目标问题, 及与目 标问题对应的第一目标答复内容; 基于第一目标 答复内容, 生成与第一目标问题对应的错误答复 内容; 基于至少一个目标语料以及与至少一个目 标语料对应的错误答复内容, 生成目标对象待答 复的问答信息。 本发明解决了 现有技术中依赖于 人工生成问答信息造成的工作成本高的技术问 题。 权利要求书2页 说明书11页 附图2页 CN 115269800 A 2022.11.01 CN 115269800 A 1.一种信息处 理方法, 其特 征在于, 包括: 获取目标对象请求问答的请求信息, 其中, 所述请求信息 至少包括问答内容; 从多个语料库中确定与所述问答内容对应的至少一个目标语料, 其中, 所述目标语料 包括第一目标问题, 及与所述目标问题对应的第一目标答复内容; 基于所述第一目标答复内容, 生成与所述第一目标问题对应的错 误答复内容; 基于所述至少一个目标语料以及与 所述至少一个目标语料对应的错误答复内容, 生成 所述目标对象待答复的问答信息 。 2.根据权利要求1所述的方法, 其特征在于, 基于所述第一目标答复内容, 生成与所述 第一目标问题对应的错 误答复内容, 包括: 基于所述第一目标答复内容生成第二目标答复内容, 其中, 所述第一目标答复内容与 所述第二目标答复内容的相似度大于第一预设阈值; 对所述第二目标答复内容进行分词处理, 得到多个分词, 并确定至少一个分词在所述 第二目标答复内容中的重要度; 基于所述至少一个分词在所述第 二目标答复内容中的重要度, 从所述多个分词中筛选 出第一目标分词; 将所述第二目标答复内容中的第 一目标分词替换为第 二目标分词, 得到替换后的第 二 目标答复内容, 其中, 所述第一目标分词与所述第二目标分词的相似度大于第二预设阈值; 确定所述 替换后的第二目标答复内容 为所述错误答复内容。 3.根据权利要求1所述的方法, 其特征在于, 在基于所述至少一个目标语料以及与 所述 至少一个目标语料对应的错误答复内容, 生成所述 目标对象待答复的问答信息之后, 所述 方法还包括: 获取目标对象答复所述问答信息的答复结果; 基于所述 答复结果, 确定所述目标对象对应的得分。 4.根据权利要求1所述的方法, 其特征在于, 从多个语料库中确定与 所述问答内容对应 的至少一个目标语料, 包括: 从所述多个 语料库中确定与所述问答内容对应的至少一个目标语句; 生成与每 个目标语句对应的第一目标问题和第一目标答复内容; 基于与所述每个目标语句对应的第 一目标问题和第 一目标答复内容, 确定每个目标语 句所对应的目标语料。 5.根据权利要求1所述的方法, 其特征在于, 在从多个语料库中确定与 所述问答内容对 应的至少一个目标语料之前, 所述方法还 包括: 从目标网站实时爬取 预设领域的目标信息; 确定与所述目标信息对应的至少一个信息类别; 基于所述目标信息的信息内容, 生成与所述至少一个信息类别对应的语料; 基于所述语料对应的信 息类别, 将所述语料存储至所述多个语料库中的第 一目标语料 库, 其中, 不同的语料库 与不同的信息类别相对应。 6.根据权利要求5所述的方法, 其特征在于, 基于所述目标信息的信息内容, 生成与所 述至少一个信息类别对应的语料, 包括以下至少之一: 基于所述信 息内容生成初始问题和初始答句, 并确定所述初始问题和初始答句为与第权 利 要 求 书 1/2 页 2 CN 115269800 A 2一信息类别对应的语料; 基于所述信 息内容确定目标文件, 并确定所述目标文件的文件内容为与第 二信息类别 对应的语料, 其中, 所述目标文件为与所述信息内容中存在的文件名称所对应的文件; 基于所述信 息内容确定目标实体关系信 息, 并确定所述目标实体关系信 息为与第 三信 息类别对应的语料, 其中, 所述 目标实体关系信息至少表征所述信息内容中存在的多个对 象之间的关联关系。 7.根据权利要求5或6所述的方法, 其特征在于, 在基于所述语料对应的信息类别, 将所 述语料存 储至所述多个 语料库中的第一目标语料库之后, 所述方法还 包括: 获取第二目标问题, 其中, 所述第二目标问题的问题内容的所属领域 为所述预设领域; 确定所述第二目标问题对应的信息类别; 基于所述第二目标问题的信息类别, 从所述多个 语料库中确定第二目标语料库; 从所述第一目标语料库中确定所述第二目标问题对应的第二目标答复内容。 8.一种信息处 理装置, 其特 征在于, 包括: 获取模块, 用于获取目标对象请求问答的请求信息, 其中, 所述请求信息至少包括问答 内容; 确定模块, 用于从多个语料库中确定与所述问答内容对应的至少一个目标语料, 其中, 所述目标语料包括第一目标问题, 及与所述目标问题对应的第一目标答复内容; 第一生成模块, 用于基于所述第一目标答复内容, 生成与所述第一目标问题对应的错 误答复内容; 第二生成模块, 用于基于所述至少一个目标语料以及与 所述至少一个目标语料对应的 错误答复内容, 生成所述目标对象待答复的问答信息 。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 程序, 其中, 所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的信息 处理方法。 10.一种电子设备, 其特征在于, 所述电子设备包括一个或多个处理器; 存储器, 用于存 储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行时, 使得所述一 个或多个处理器实现用于运行程序, 其中, 所述程序被设置为运行时执行所述权利要求 1至 7任一项中所述的信息处 理方法。权 利 要 求 书 2/2 页 3 CN 115269800 A 3

PDF文档 专利 信息处理方法、装置、计算机可读存储介质及电子设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 信息处理方法、装置、计算机可读存储介质及电子设备 第 1 页 专利 信息处理方法、装置、计算机可读存储介质及电子设备 第 2 页 专利 信息处理方法、装置、计算机可读存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。