全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210313514.7 (22)申请日 2022.03.28 (71)申请人 上海易康源医疗健康科技有限公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区临港新片区新杨公路 860号10幢 (72)发明人 曾祥云 朱姬渊  (74)专利代理 机构 上海硕力知识产权代理事务 所(普通合伙) 31251 专利代理师 刘桂芝 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) G06F 16/332(2019.01)G06F 16/36(2019.01) G06F 40/237(2020.01) G06F 40/295(2020.01) (54)发明名称 神经网络训练方法及神经网络、 问答系统及 方法 (57)摘要 本发明公开一种神经网络训练方法及神经 网络、 问答系统及方法, 其神经网络训练方法包 括步骤: S1:数据准备; S2:句子特征分析处理; S3:分布初 始化; S4:创建回答列表; S5:指令网络 单元初始化及处理; S6:关系和 实体初始化; S7: 推理网络单元初始化及处理; S8:求损失值并训 练。 本发明能够深层挖掘多级语义关系, 大大提 高了语义分析的准确率, 提高了应用的准确性, 如检索、 预测、 推荐等需求场景。 权利要求书2页 说明书6页 附图1页 CN 114781595 A 2022.07.22 CN 114781595 A 1.一种神经网络训练方法, 其特 征是, 包括步骤: S1:数据准备; S2:句子特 征分析处 理; S3:分布初始化; S4:创建回答列表; S5:指令网络单 元初始化及处 理; S6:关系和实体初始化; S7:推理网络单 元初始化及处 理; S8:求损失值并训练。 2.如权利要求1所述的神经网络训练方法, 其特 征是, S1:数据准备步骤 包括: S10:神经网络的参数设置, 包括对指数衰减、 激活函数以及优化方法的选择和设置; S11:加载数据, 包括: 加载entity, relati on和vocab文件, 获取实体, 词语和关系对应的id; 加载数据集sample和dep文件, 获取问答、 子图关系和实体, 以及问题的句法分析信息; S12: id映射: 将sample文件中包含有问题的句子中的实体以及与有问题的问题句子中实体相 关联 子图的节点, 生成g2 l元素的字典用以表示全局id以及当前id的转换, 并统计所有行中最多 的实体数。 3.如权利要求1所述的神经网络训练方法, 其特 征是, S2:句子特 征分析处 理步骤包括: S20:对包含有问题的句子的句法的依存关系进行分析: 抽取出句子中每个词的父节点 编号、 关系类型和所在 层级关系; S21:对问句实体进行分析, 创建问句实体矩阵; S22:对句子关系进行处理: 去除子图部分的开始节点、 结束节点和关系id, 构 建成知识 图谱矩阵。 4.如权利要求1所述的神经网络训练方法, 其特 征是, S4:创建回答列表步骤 包括: 创建回答列表, 存放每 个回答实体的id号; 创建回答字典作为标签, 在回答实体的位置取值。 5.如权利要求1所述的神经网络训练方法, 其特征是, S5:指令网络单元初始化及处理 包括: 对输入问题进行编码, 转 化为多维矩阵; 以LSTM抽取 特征, 形成知识 矩阵, 并进行初始化; 对知识矩阵进行处 理, 得到指令矩阵。 6.如权利要求1所述的神经网络训练方法, 其特 征是, S6:关系和实体初始化具体为: 对关系进行升维的嵌入处 理, 再通过线性层进行降维处 理; 对实体进行升维嵌入处 理, 再经过与嵌入处 理相同维度的线性层。 7.如权利要求1所述的神经网络训练方法, 其特征是, S7:推理网络单元初始化及处理 包括: 构建关系、 头、 尾以及事实之间的稀疏矩阵; 将当前实体分布、 指令操作输出和关系表征传入图卷积网络中进行处理, 最后更新分权 利 要 求 书 1/2 页 2 CN 114781595 A 2布矩阵。 8.一种神经网络, 其特征在于, 所述神经网络为权利要求1至6任一之神经网络训练方 法所得, 包括指令网络单 元、 推理网络单 元以及学习网络单 元, 其中, 指令网络单元基于图神经网络以及LSTM构成, 用以将输入的问题转化成推理指令矩阵 i; 推理网络单 元为图卷积神经网络, 用以对推理指令矩阵i进行分析, 得到实体分布p; 学习网络为师 徒网路, 用以对实体分布p进行推理分析。 9.一种问答系统, 包括交 互单元以及处 理单元, 其中: 所述交互单元用以接收用户的输入信息以及显示处 理单元的结果; 处理单元用以对用户的输入信息进行处 理, 并返回处 理结果, 其特征在于, 处理单元为权利要求1至6任一之神经网络训练方法所得的神经网络或者 权利要求7 所述的神经网络 。 10.一种问答方法, 包括 步骤: 交互单元接收用户的输入信息以及显示处 理单元的结果; 处理单元对用户的输入信息进行处 理, 并返回处 理结果, 其特征在于, 处理单元为权利要求1 ‑6任一之神经网络训练方法所得的神经网络或者 权利要求7 所述的神经网络 。权 利 要 求 书 2/2 页 3 CN 114781595 A 3

.PDF文档 专利 神经网络训练方法及神经网络、问答系统及方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 神经网络训练方法及神经网络、问答系统及方法 第 1 页 专利 神经网络训练方法及神经网络、问答系统及方法 第 2 页 专利 神经网络训练方法及神经网络、问答系统及方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:59:45上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。