说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211387971.7 (22)申请日 2022.11.08 (71)申请人 天嘉科技 (南京) 有限公司 地址 210046 江苏省南京市栖霞区尧化 街 道科创路1号金港科创园一期1号楼 110-A室 (72)发明人 曹少天 徐培宇 周雪  (74)专利代理 机构 苏州科权知识产权代理事务 所(普通合伙) 32561 专利代理师 杨文龙 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 40/279(2020.01) (54)发明名称 适用于虚拟机器人的自然语言数据处理方 法及系统 (57)摘要 本申请提供一种适用于虚拟机器人的自然 语言数据处理方法及系统。 该方法通过终端设备 获取自闭症患者的指令语句, 并通过专注力头环 获取自闭症患者的专注度值, 然后, 专注力头环 根据专注度值 以及预设专注度区间范围确定处 理指令, 并将处理指令发送至终端设备, 以指示 终端设备根据处理指令确定对应的目标自然语 言处理模型, 终端设备根据目标自然语 言处理模 型对指令语句进行处理, 并根据处理结果以及专 注度值确定回复语句, 最后, 终端设备根据回复 语句的内容信息确定对应形象类型的目标虚拟 机器人, 并通过目标虚拟机器人播放回复语句, 从而以满足自闭症患者不同专注度状态下的交 互需求。 权利要求书3页 说明书13页 附图3页 CN 115438168 A 2022.12.06 CN 115438168 A 1.一种适用于虚拟机器人的自然语言数据处理方法, 其特征在于, 应用于虚拟机器人 交互系统, 所述系统包括: 终端设备以及与所述 终端设备通信连接的专注力头环, 所述 终端 设备中配置有不同形象类型的虚拟机器人; 所述方法, 包括: 通过所述终端设备获取自闭症患 者的指令语句, 并通过所述专注力 头环获取所述自闭 症患者的专 注度值; 所述专注力 头环根据 所述专注度值以及预设专注度区间范围确定处理指令, 并将所述 处理指令发送至所述 终端设备, 以指示所述 终端设备根据所述处理指 令确定对应的目标自 然语言处 理模型; 所述终端设备根据所述目标自然语言处理模型对所述指令语句进行处理, 并根据处理 结果以及所述专 注度值确定回复语句; 所述终端设备根据所述 回复语句的内容信 息确定对应形象类型的目标虚拟机器人, 并 通过所述目标虚拟机器人播 放所述回复语句。 2.根据权利要求1所述的适用于虚拟机器人的自然语言数据处理方法, 其特征在于, 在 所述终端设备根据所述目标自然语言处 理模型对所述指令语句进行处 理之前, 还 包括: 对所述指令语句进行分词处 理, 并根据分词结果构建所述指令语句对应的文本序列; 根据所述自然语言处 理模型计算所述指令语句对应的所述文本序列出现的概 率; 若所述概率大于预设阈值, 则确定所述指令语句为 正常指令 。 3.根据权利要求2所述的适用于虚拟机器人的自然语言数据处理方法, 其特征在于, 所 述专注力头环根据所述专 注度值以及预设专 注度区间范围确定处 理指令, 包括: 若所述专注度值处于预设第一专注度区间, 则所述处理指令为第一处理指令, 所述第 一处理指令用于指示所述终端设备选择第一自然语言处 理模型; 若所述专注度值处于预设第二专注度区间, 则所述处理指令为第二处理指令, 所述第 二处理指令用于指示所述终端设备选择第二自然语言处 理模型; 其中, 所述预设第二专注度区间的最小值为所述预设第一专注度区间的最大值; 在所 述第一自然语言处理模型中, 计算所述指令语句对应的所述文本序列出现的概率时, 所述 文本序列中的M个分词相互关联; 在所述第二自然语 言处理模 型中, 计算所述指 令语句对应 的所述文本序列出现 的概率时, 所述文本序列中的N个分词相互关联; M与N为大于1的正整 数, 且N大于 M。 4.根据权利要求3所述的适用于虚拟机器人的自然语言数据处理方法, 其特征在于, 在 所述第一自然语言处理模型中, 所述指令语句对应的所述文本序列出现的概率的计算公式 为: ; ; 其中, 为所述文本序列中的第n个分词,   为 在第一预设语料库中出现的次 数, 所述第一预设语料库为基于自闭症患者常用语言所建立的语料库; 在所述第二自然语言处理模型中, 所述指令语句对应的所述文本序列 出现的概率的计 算公式为: ;权 利 要 求 书 1/3 页 2 CN 115438168 A 2; 其中, 所述文本序列为 , 为所述文本序列中的第n个分词,   为 序列在预设语料库中出现的次数, 为 序列在预设语料库中出现的次数; 所述预设语料 库为在基础语料库的基础上 结合自闭症患者常用语言所建立的语料库。 5.根据权利要求4所述的适用于虚拟机器人的自然语言数据处理方法, 其特征在于, 所 述根据处理结果以及所述专 注度值确定回复语句, 包括: 根据所述处理结果以及预设问答模型确定初始回复语句, 其中, 所述预设问答模型基 于Seq2seq模型建立; 若所述专注度值处于所述预设第 一专注度区间, 且所述初始回复语句的字数大于预设 字数, 则对所述初始回复语句进 行精简处理, 以生成所述回复语句, 所述回复语句的字数小 于所述预设字数; 若所述专注度值处于所述预设第 一专注度区间, 且所述初始回复语句的字数小于或等 于预设字数, 则所述回复语句为所述初始回复语句; 若所述专注度值处于所述预设第二专注度区间, 则所述回复语句为所述初始回复语 句。 6.根据权利要求5所述的适用于虚拟机器人的自然语言数据处理方法, 其特征在于, 所 述对所述初始回复语句进行精简处 理, 以生成所述回复语句, 包括: 根据预设停用词表过 滤所述初始回复语句中的停用词, 以生成中间回复语句; 对所述中间回复语句进行分词处理, 以确定所述中间回复语句所对应的第一文本序 列; 根据预设词性指定规则保留所述第 一文本序列中指定词性的词语, 以形成第 二文本序 列; 将所述第二文本序列中的各个词语设置为PageRank算法中的一个节点, 并通过所述 PageRank算法计算得到的重要性 最高的若干词语, 以形成第三文本序列; 根据所述第三文本序列生成所述回复语句。 7.根据权利要求3 ‑6中任意一项所述的适用于虚拟机器人的自然语言数据处理方法, 其特征在于, 还 包括: 通过所述终端设备获取沟通人员的沟通语句; 若所述专注度值处于所述预设第 一专注度区间, 则根据 预设停用词表过滤所述沟通语 句中的停用词, 以生成中间沟通语句; 对所述中间沟通语句进行分词处理, 以确定所述中间沟通语句所对应的第四文本序 列; 根据预设词性指定规则保留所述第四文本序列中指定词性的词语, 以形成第五文本序 列; 将所述第五文本序列中的各个词语设置为PageRank算法中的一个节点, 并通过所述 PageRank算法计算得到的重要性 最高的若干词语, 以形成第六文本序列;权 利 要 求 书 2/3 页 3 CN 115438168 A 3

PDF文档 专利 适用于虚拟机器人的自然语言数据处理方法及系统

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 适用于虚拟机器人的自然语言数据处理方法及系统 第 1 页 专利 适用于虚拟机器人的自然语言数据处理方法及系统 第 2 页 专利 适用于虚拟机器人的自然语言数据处理方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:49:07上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。