全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211030881.2 (22)申请日 2022.08.26 (71)申请人 上海大学 地址 200444 上海市宝山区上 大路99号 (72)发明人 费敏锐 沈赟怡 周文举 王海宽  徐昱琳 易开祥 李晨辉 吕泽昊  (74)专利代理 机构 上海智信专利代理有限公司 31002 专利代理师 王洁 郑暄 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/18(2020.01) G06F 40/30(2020.01)G06K 9/62(2022.01) (54)发明名称 用于科技 服务的任务型问答系统及其方法 (57)摘要 本发明涉及一种用于科技服务的任务型问 答系统及其方法, 其通过与机器客服的对话交 互, 实现科技资源服务, 包括: 用户注册、 购买服 务、 资源寻求等常见功能。 该方法根据实际需求 设计了符合科技服务的业务场景, 收集了围绕科 技资源服务相关的文本数据。 本发 明使用基于管 道型的问答系统流程架构, 分别针对自然语言理 解模块、 对话管理系统模块、 自然语言生成模块, 进行针对科技服务应用场景的数据库表设计, 旨 在于得到更为人性化、 合理的问答结果。 本发明 还涉及到了一个新型算法模型, 将ALBERT结合对 抗训练, 搭建AT ‑ALBERT模型, 用以提高自然语言 处理模块中用户意图识别的准确性。 最终, 构建 了专属于科技资源服务这个垂直领域的任务型 问答方法。 权利要求书1页 说明书9页 附图2页 CN 115391510 A 2022.11.25 CN 115391510 A 1.一种用于科技服务的任务型问答系统, 其特征在于, 包含如下四个模块: 数据采集处 理模块、 自然语言理解模块、 对话管理系统模块、 自然语言生 成模块, 其中, 所述数据采集处 理模块用于收集有关于科技资源服务相关的文本数据, 并且对其按照所设计的业务场景中 的实际需求, 进行相应的标注工作; 所述自然语言理解模块与所述的数据采集处理模块相 连接, 用于将用户输入的非结构化数据转化为结构化数据, 再输入到对话管理系统模块中; 所述的对话管理系统模块与所述的自然语言理解模块相连接, 分别基于填槽法进 行对话管 理与基于有限状态自动机进行对话管理; 所述的自然语言生成模块与所述的对话管理系统 模块相连接, 把对话管理系统模块生成的结构化数据转变为非结构化文本数据, 即利用对 话管理系统模块中所得到的动作决策信息 设计规则, 定义系统的动作和所包含变量之 间的 关联映射。 2.根据权利要求1所述的用于科技服务的任务型问答系统方法, 其特征在于, 所述的自 然语言理解模块包含意图识别部分和语义槽填充部 分, 所述的意图识别部 分用于进行文本 分类, 所述的语义槽填充部 分用于进 行序列标注, 使用A LBERT模型结合对抗训练的组合, 构 成AT‑ALBERT新型模型, 来实现数据分布式表示、 特 征提取以及序列标注。 3.根据权利要求1所述的用于科技服务的任务型问答系统方法, 其特征在于, 所述的对 话管理系统模块, 针对科技资源服务分析需求, 设计合理的业务场景, 创建相应的数据库 表, 并且添加空白语义槽位选择机制, 通过相似度排序, 对下一个进 行提问的槽位进 行优先 级排序。 4.一种基于权利要求1所述的系统用于科技服务的任务型问答方法, 其特征在于, 所述 的方法包括以下步骤: (1)根据科技资源服 务的特殊 业务场景需求, 设计意图类型与单词标注标签 类型; (2)收集关于科技资源服 务相关文本数据, 为源数据进行BIO标注; (3)对数据进行嵌入表示的处 理工作, 得到可以输入后续模型中的数据格式; (4)训练关于意图识别和语义槽填充任务的模型, 构造新型模型 结构; (5)针对于对话管理系统模块设计一个 状态机中包 含的数据; (6)针对于对话管理系统模块设计槽填充表的状态机类型分布; (7)针对于对话管理系统模块和自然语言生成模块, 设计对话管理系统模块中所涉及 到的表格。权 利 要 求 书 1/1 页 2 CN 115391510 A 2用于科技服务的任务型问答系统及其方 法 技术领域 [0001]本发明涉及科技服务领域, 尤其涉及针对于科技资源服务方面的自然语言处理技 术领域, 具体是指一种用于科技 服务的任务型问答系统及其方法。 背景技术 [0002]科技服务同样作为第三方业务平台, 与电商、 餐饮、 打车等其它垂直领域的第三方 平台相比, 其平台的建设规模与建设精细化程度远远不及。 具体表现在系统技术开发不完 全、 平台普及度受限等问题。 而对比国内外的科技服务行业, 我国在该行业有着起步晚、 发 展速度快的特点, 目前正处于一个发展平稳程度陡峭, 相对较为稚嫩的发展阶段。 我国的科 技服务行业在其行业体系化建设的过程中, 可以进行垂直对比和水平对比, 对标其它 行业 领域和国外相同领域的第三方平台, 以其作为参考借鉴对 象, 最终落地于我国的科技资源 服务平台的构建中。 [0003]如今对我国科技服务平台的研究不在少数, 大多数的研究重点聚焦于平台的基础 功能构建, 从平台功能的丰富度出发, 类似于推荐算法、 客服服务的功能堆叠都是可以发展 研究的对象。 而且, 以科技资源服务平台最初创建的目的出发, 旨在为科技资源的买卖双方 寻求到其需求适配度最高的资源。 面向科技服务资源的任务型问答系统由此而生, 在为平 台丰富技术功 能的同时, 其本质更是为用户体验度的提升, 科技资源的合理调度匹配提供 更多样化的技术手段。 但同时, 任务型问答系统虽然在其算法方面的发展之迅速, 其所涉及 的垂直领域少有科技 服务行业, 该 领域用于问答系统的数据构建也必不可少。 发明内容 [0004]本发明的目的是克服了上述现有技术的缺点, 提供了一种满足操作简便、 满足多 样化的需求、 适用范围较为广泛的一种用于科技 服务的任务型问答系统及其方法。 [0005]为了实现上述目的, 本发明的用于科技 服务的任务型问答系统及其方法如下: [0006]该用于科技服务的任务型问答系统, 其主要特点是, 所述的系统包括数据采集处 理模块、 自然语言理解模块、 对话管理系统模块、 自然语言生成模块, 整体的问答系统被概 述为基于管道型 的问答系统技术框架。 其中, 数据采集处理模块包含收集有关于科技资源 服务相关的大量文本数据, 并且对其按照所设计的业务场景需求分析进行相应的标注工 作, 为后续模块中的文本分类与序列标注问题做铺垫; 自然语言理解模块将用户输入的非 结构化数据转化为结构化数据再输入到对话管理系统模块中, 其包含两部分内容: 意图识 别和语义槽填充, 前者是文本 分类问题, 后者是序列标注问题, 使用A LBERT模型结合对抗训 练的组合, 构成AT ‑ALBERT新型模型, 来实现数据分布 式表示、 特征提取以及序列标注的功 能; 在对话管理系统模块中将两种常见 的相关实现方法进行融合改进, 充分利用基于填槽 法的对话管理方法与基于有限状态自动机的对话管理方法, 具体表现在状态转移和 动作决 策两部分; 自然语言生成模块将由对话管理系统模块中生成的结构化数据在转变为 非结构 化数据, 即对话管理系统模块中所得的动作决策, 使用基于规则的方法来予以实现, 其中,说 明 书 1/9 页 3 CN 115391510 A 3

PDF文档 专利 用于科技服务的任务型问答系统及其方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于科技服务的任务型问答系统及其方法 第 1 页 专利 用于科技服务的任务型问答系统及其方法 第 2 页 专利 用于科技服务的任务型问答系统及其方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:02上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。