(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211309557.4 (22)申请日 2022.10.25 (71)申请人 武汉市聚联科 软件有限公司 地址 430100 湖北省武汉市蔡甸区大集 街 银燕村、 国利村(武汉汇力投资有限公 司3#厂房一层13 5室) (72)发明人 周帅 杨晨  (74)专利代理 机构 北京金智普华知识产权代理 有限公司 1 1401 专利代理师 张晓博 (51)Int.Cl. G06F 16/23(2019.01) G06F 40/30(2020.01) (54)发明名称 一种自然语 言处理系统的自动更新系统、 终 端以及设备 (57)摘要 本发明属于自然语 言处理技术领域, 公开了 一种自然语言处理系统的自动更新系统、 终端以 及设备, 包括: 更新判断模块、 处理数据获取模 块、 中央控制模块、 数据归一化处理模块、 历史处 理规则获取模块、 数据提取模块、 数据补充修复 模块、 数据筛选模块、 数据分析模块、 处理规则生 成模块、 处理规则更新模块以及自然语 言处理模 块。 本发明通过对自然语言处理系统进行迭代更 新, 不仅降低了更新时的数据处理量, 降低了更 新的成本, 提高了更新的效率, 同时还能够提高 客户的满意度, 让自然语言处理系统保持活力, 从而进一步获取更多的交互数据进行自然语言 处理系统的丰富。 权利要求书2页 说明书5页 附图2页 CN 115510080 A 2022.12.23 CN 115510080 A 1.一种自然语言处理系统的自动更新系统, 其特征在于, 所述自然语言处理系统的自 动更新系统包括: 数据补充修复模块, 与中央控制模块连接, 用于基于语义分析结果以及数据提取结果 进行处理数据的补充修复; 数据筛选模块, 与中央控制模块连接, 用于对关联数据集中的数据进行筛选生成有效 关联数据集; 数据分析模块, 与中央控制模块连接, 用于基于得到的有效关联 数据集进行语义分析; 处理规则生成模块, 与中央控制模块连接, 用于基于所述有效关联数据集的语义分析 结果生成新的处 理规则; 处理规则更新模块, 与中央控制模块连接, 用于基于新的处理规则进行自然语言处理 规则库的更新; 自然语言处理模块, 与中央控制模块连接, 用于基于更新后的自然语言处理规则库中 的自然语言处 理规则进行自然语言处 理。 2.如权利要求1所述自然语言处理系统 的自动更新系统, 其特征在于, 所述自然语言处 理系统的自动更新系统还 包括: 更新判断模块, 与中央控制模块连接, 用于获取自然语言处理系统更新时间间隔以及 所述更新时间 间隔内的评价结果并判断是否需要更新; 处理数据获取模块, 与中央控制模块连接, 用于获取自上一次更新至本次更新期间的 待更新的自然语言处 理系统处理的数据; 中央控制模块, 与更新判断模块、 处理数据获取模块、 数据归一化处理模块、 历史处理 规则获取模块、 数据提取模块、 数据补充修复模块、 数据筛选模块、 数据分析模块、 处理规则 生成模块、 处理规则更新模块以及自然语言处理模块连接, 用于利用单片机或控制器控制 各个模块 正常工作; 数据归一化处理模块, 与中央控制模块连接, 用于对获取的待更新的自然语言系统处 理的数据进行归一 化处理; 历史处理规则获取模块, 与中央控制模块连接, 用于获取待更新的自然语言处理系统 的自然语言处 理规则库; 数据提取模块, 与中央控制模块连接, 用于从归一 化处理后的数据中提取关联 数据集。 3.如权利要求2所述自然语言处理系统 的自动更新系统, 其特征在于, 所述更新判断模 块获取自然语言处理系统更新时间间隔以及所述更新时间间隔内的评价结果并判断是否 需要更新包括: (1)获取自然语言处理系统最近一次更新时间与当前时间进行对比, 判断所述自然语 言处理系统最近一次更新时间与当前时间的时间间隔是否小于预设更新时间阈值, 若否, 则转向步骤(2); 若是, 则进行 所述自然语言处 理系统的更新; (2)获取获取自然语言处理系统最近一 次更新时间与当前时间间隔内的评分以及评价 数据, 当所述评分低于预设评分阈值或所述评价数据中出现指定出题词时, 则进行所述自 然语言处 理系统的更新, 否则, 判断所述自然语言处 理系统未到更新时间。 4.如权利要求2所述自然语言处理系统 的自动更新系统, 其特征在于, 所述数据提取模 块从归一 化处理后的数据中提取关联 数据集包括:权 利 要 求 书 1/2 页 2 CN 115510080 A 2首先, 获取归一化处理后的待更新的自然语言系统处理的数据, 从归一化处理后的待 更新的自然语言系统处理的数据中提取评 分低于预设评 分阈值的处理数据, 作为第一关联 数据; 其次, 对删除第一关联数据后的待更新的自然语言系统处理的数据中进行提问主题词 提取, 并按照提取的提问主题词对删除第一关联数据后的待 更新的自然语言系统处理的数 据进行分类处 理; 再者, 判断提取的各个提问主题词是否存在当前自然语言处理规则库中, 若存在当前 自然语言处理规则库中, 则确定所述提问主题词对应的处理数据是否生成正确 答案, 若未 生成正确答案, 则将对应数据作为第二关联 数据; 然后, 若未存在当前处理规则中, 则判断所述提问主题词是否与所述自然语言处理系 统应用场景相关, 若相关, 则将所述 提问主题词对应的数据作为第三关联 数据; 最后, 基于所述第一关联 数据、 第二关联 数据、 第三关联 数据得到关联 数据集。 5.如权利要求4所述自然语言处理系统 的自动更新系统, 其特征在于, 所述确定提问主 题词对应的处 理数据是否生成正确答案包括: 通过计算所述处理数据中生成的答复数据与所述提问主题词的关联性大小结合所述 提问主题词所在的提问语句进行语义分析确定生成的答复数据是否为 正确答案 。 6.如权利要求1所述自然语言处理系统 的自动更新系统, 其特征在于, 所述数据筛选模 块对关联 数据集中的数据进行筛 选生成有效关联 数据集包括: 对关联数据集中的数据进行查重以及质量评价, 并基于查重、 质量评价结果进行数据 的筛选结合补充修复后的数据得到有效关联 数据集。 7.如权利要求1所述自然语言处理系统 的自动更新系统, 其特征在于, 所述处理规则更 新模块基于新的处 理规则进行自然语言处 理规则库的更新包括: 将新生成的处理规则补充添加至所述自然语言处理规则库中或替换所述自然语言处 理规则库中的规则, 得到更新后的自然语言处 理规则库。 8.一种计算机设备, 其特征在于, 所述计算机设备包括存储器和处理器, 所述存储器存 储有计算机程序, 所述计算机程序被所述处理器执行时, 使得所述处理器实现如权利要求 1‑7任意一项所述自然语言处 理系统的自动更新系统。 9.一种计算机可读存储介质, 存储有计算机程序, 所述计算机程序被处理器执行时, 使 得所述处理器实现如权利要求1 ‑7任意一项所述自然语言处 理系统的自动更新系统。 10.一种信息数据处理终端, 其特征在于, 所述信息数据处理终端用于实现如权利要求 1‑7任意一项所述自然语言处 理系统的自动更新系统。权 利 要 求 书 2/2 页 3 CN 115510080 A 3

.PDF文档 专利 一种自然语言处理系统的自动更新系统、终端以及设备

安全报告 > 其他 > 文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种自然语言处理系统的自动更新系统、终端以及设备 第 1 页 专利 一种自然语言处理系统的自动更新系统、终端以及设备 第 2 页 专利 一种自然语言处理系统的自动更新系统、终端以及设备 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生2024-02-07 20:38:25上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。