专利神经网络训练方法及神经网络、问答系统及方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210313514.7 (22)申请日 2022.03.28 (71)申请人上海易康源医疗健康科技有限公司地址 200120 上海市浦东新区中国(上海) 自由贸易试验区临港新片区新杨公路 860号10幢 (72)发明人曾祥云　朱姬渊　 (74)专利代理机构上海硕力知识产权代理事务所(普通合伙) 31251 专利代理师刘桂芝 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) G06F 16/332(2019.01)G06F 16/36(2019.01) G06F 40/237(2020.01) G06F 40/295(2020.01) (54)发明名称神经网络训练方法及神经网络、问答系统及方法 (57)摘要本发明公开一种神经网络训练方法及神经网络、问答系统及方法，其神经网络训练方法包括步骤： S1:数据准备； S2:句子特征分析处理； S3:分布初始化； S4:创建回答列表； S5:指令网络单元初始化及处理； S6:关系和实体初始化； S7: 推理网络单元初始化及处理； S8:求损失值并训练。本发明能够深层挖掘多级语义关系，大大提高了语义分析的准确率，提高了应用的准确性，如检索、预测、推荐等需求场景。权利要求书2页说明书6页附图1页 CN 114781595 A 2022.07.22 CN 114781595 A 1.一种神经网络训练方法，其特征是，包括步骤： S1:数据准备； S2:句子特征分析处理； S3:分布初始化； S4:创建回答列表； S5:指令网络单元初始化及处理； S6:关系和实体初始化； S7:推理网络单元初始化及处理； S8:求损失值并训练。 2.如权利要求1所述的神经网络训练方法，其特征是， S1:数据准备步骤包括： S10:神经网络的参数设置，包括对指数衰减、激活函数以及优化方法的选择和设置； S11:加载数据，包括：加载entity， relati on和vocab文件，获取实体，词语和关系对应的id；加载数据集sample和dep文件，获取问答、子图关系和实体，以及问题的句法分析信息； S12： id映射: 将sample文件中包含有问题的句子中的实体以及与有问题的问题句子中实体相关联子图的节点，生成g2 l元素的字典用以表示全局id以及当前id的转换，并统计所有行中最多的实体数。 3.如权利要求1所述的神经网络训练方法，其特征是， S2:句子特征分析处理步骤包括： S20:对包含有问题的句子的句法的依存关系进行分析：抽取出句子中每个词的父节点编号、关系类型和所在层级关系； S21:对问句实体进行分析，创建问句实体矩阵； S22:对句子关系进行处理：去除子图部分的开始节点、结束节点和关系id，构建成知识图谱矩阵。 4.如权利要求1所述的神经网络训练方法，其特征是， S4:创建回答列表步骤包括：创建回答列表，存放每个回答实体的id号；创建回答字典作为标签，在回答实体的位置取值。 5.如权利要求1所述的神经网络训练方法，其特征是， S5:指令网络单元初始化及处理包括：对输入问题进行编码，转化为多维矩阵；以LSTM抽取特征，形成知识矩阵，并进行初始化；对知识矩阵进行处理，得到指令矩阵。 6.如权利要求1所述的神经网络训练方法，其特征是， S6:关系和实体初始化具体为：对关系进行升维的嵌入处理，再通过线性层进行降维处理；对实体进行升维嵌入处理，再经过与嵌入处理相同维度的线性层。 7.如权利要求1所述的神经网络训练方法，其特征是， S7:推理网络单元初始化及处理包括：构建关系、头、尾以及事实之间的稀疏矩阵；将当前实体分布、指令操作输出和关系表征传入图卷积网络中进行处理，最后更新分权　利　要　求　书 1/2 页 2 CN 114781595 A 2布矩阵。 8.一种神经网络，其特征在于，所述神经网络为权利要求1至6任一之神经网络训练方法所得，包括指令网络单元、推理网络单元以及学习网络单元，其中，指令网络单元基于图神经网络以及LSTM构成，用以将输入的问题转化成推理指令矩阵 i；推理网络单元为图卷积神经网络，用以对推理指令矩阵i进行分析，得到实体分布p；学习网络为师徒网路，用以对实体分布p进行推理分析。 9.一种问答系统，包括交互单元以及处理单元，其中：所述交互单元用以接收用户的输入信息以及显示处理单元的结果；处理单元用以对用户的输入信息进行处理，并返回处理结果，其特征在于，处理单元为权利要求1至6任一之神经网络训练方法所得的神经网络或者权利要求7 所述的神经网络。 10.一种问答方法，包括步骤：交互单元接收用户的输入信息以及显示处理单元的结果；处理单元对用户的输入信息进行处理，并返回处理结果，其特征在于，处理单元为权利要求1 ‑6任一之神经网络训练方法所得的神经网络或者权利要求7 所述的神经网络。权　利　要　求　书 2/2 页 3 CN 114781595 A 3

专利 神经网络训练方法及神经网络、问答系统及方法

专利神经网络训练方法及神经网络、问答系统及方法