(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211298191.5
(22)申请日 2022.10.21
(71)申请人 北京航空航天大 学
地址 100191 北京市海淀区学院路37号
(72)发明人 林京 张天 焦金阳 李豪
(74)专利代理 机构 北京孚睿湾知识产权代理事
务所(普通 合伙) 11474
专利代理师 刘翠芹
(51)Int.Cl.
G01M 13/00(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于多尺度注意力的原型适配机械设备故
障诊断方法
(57)摘要
本发明提供一种基于多尺度注意力的原型
适配网络的机械设备故障诊断方法, 其包括: 对
原型网络进行重构, 建立基于多尺度注意力的以
一个深层编码结构为主体的原型约束优化网络;
基于伪标签学习策略, 提出基于预测偏差的跨域
原型适配策略; 在此基础上, 减小不同领域间同
类嵌入原型的差异, 提出一种基于预测偏差的高
置信原型适配策略; 模型训练收敛后, 利用网络
适配之后的原型对无标注目标样本进行健康状
态辨识, 实现故障诊断。 通过监督原型损失约束
以及不同领域间的嵌入原型适配, 实现不同领域
间的特征嵌入最优化; 本发明充分考虑到监测数
据的稀缺性以及目标域的无标签性, 使训练出的
诊断模型能够更好地服务于机械设备健康状态
监测。
权利要求书3页 说明书9页 附图5页
CN 115508073 A
2022.12.23
CN 115508073 A
1.一种基于多尺度注意力的原型适配网络的机械设备故障诊断方法, 其特征在于, 其
包括以下步骤:
S1、 针对具有多种不同健康状态的机械设备, 采集M种不同工况下的振动监测数据, 获
得M种不同工况的振动监测数据集{X,Y}, X为振动监测数据, Y为振动监测数据的标签;
S2、 在M种不同工况的振动监测数据集{X,Y}中选取其 中一个工况的监测数据集作为训
练集, 即源领域, 并选取第二工况的监测数据集作为测试集, 即目标域, 构建一组包含训练
集和测试集的诊断任务;
S3、 对作为源领域的训练集和作为目标域的测试集的数据进行数据标准化, 构建标准
化的训练数据集和 测试数据集;
S4、 建立基于多尺度注意力的原型适配网络的机械设备故障诊断模型, 所述机械设备
故障诊断模型的网络架构采用一 维卷积神经网络搭建, 包括一个卷积特征提取网络以及一
个多尺度 注意力模块组成编 码网络结构, 其中, 卷积特征提取网络结构包含四个卷积层、 非
线性激活函数、 BatchNorm标准化层、 池化层以及一个多尺度注意力模块, 具体建立过程包
括以下步骤:
S41、 构建诊断模型在有监督训练阶段的Episode数据集, 在标准化后的训练集的每类
中随机选择K个样本组成支撑集S, 在每类的剩余样本中随机筛选一定量的样本组成查询集
Q;
S42、 构建多尺度注意力原型网络, 获取多尺度注意力原型网络损失函数; 所述多尺度
注意力原型网络包含一个特征编码器、 一个多尺度注意力模块以及一个有监督损失; 利用
步骤S41中获得的支撑集S和查询集Q对多尺度注意力原型网络进行训练, 获得训练完成的
类原型嵌入表示, 获取源领域类原型的嵌入表示
以及多尺度注意力 原型网络损失函
数
其中 μ为原型表示, s表示源领域, C为类别数, c为类别序号;
S43、 为测试集样本分配伪标签, 利用步骤S42中获得的原型表示为每个测试集中无标
签样本分配伪 标签, 获得带有伪 标签的测试集样本
其中
为测试集样本,
为对应样本的伪标签, i 为样本序号, t 表示目标 领域, nt为目标领域样本数;
S44、 评估伪标签预测 偏差, 自适应筛选伪标签; 计算训练集中查询集样本和步骤S43中
已分配伪 标签测试集样本的相似度, 利用SoftMax函数转换为概率分布; 在步骤S42中获得
了训练集类原型和查询集样 本相似度的概率分数分布, 通过KL散度在类级别计算训练集中
查询集样本和步骤S43中已分配伪标签测试集样本相 似度的概率分数分布与在步骤S42中
得到的训练集类原型和查询集样本相似度的概率分数分布的差异, 并采用指数操作将其约
束在[0,1]的区间内, 将计算结果作为伪标签筛选的置信阈值, 获得符合当前网络预测的伪
标签测试样本集;
S45、 跨域原型匹配, 获取原型适配损失函数; 计算测试集中伪标签对应样本的嵌入类
原型表示即伪原型表示
在此基础上计算训练集原型表示与测试集伪 原型表示的相
似度, 并将此相似度作为原型适配 过程损失函数
以在类级别约束源领域和目标领域的
数据分布差异;
S46、 总体损失优化, 确定总体损失函数; 结合步骤S42多尺度注意力原型网络约束损失权 利 要 求 书 1/3 页
2
CN 115508073 A
2和步骤S45中基于预测偏差估计的原型跨域适配损失, 获得基于多尺度注意力的原型适配
预诊断模型的总体损失函数, 总体优化目标为:
式中:
为总体损失函数; α和β为权重系数;
为多尺度注意力原型网络损失函数;
为原型适配损失函数;
S47、 使用Adam梯度下降方法优化步骤S45中的总体优化目标, 当步骤S45中获得的总体
优化目标最小或达到设定的迭代 次数时, 获得基于多尺度注意力的原型适配诊断模型; 否
则重复步骤S41 ‑S47;
S5、 将采集到的机械设备的振动监测数据输入步骤S46中获得的基于多尺度注意力的
原型适配网络的机 械设备故障诊断模型中, 进行健康状态辨识。
2.根据权利要求1所述的基于多尺度注意力的原型适配网络的机械设备故障诊断方
法, 其特征在于, 所述 步骤S42中的多尺度注意力原型网络损失函数
为:
式中: nq为查询集样本个数; c为样本所属类别; p(*)为预测概率;
为查询集第i个样
本;
为样本
的真实标签; d为相似度计算函数, 其中
为
支撑集第i个样本; θe为可训练的网络参数; |Dc|为送入网络的支撑集样本数。
3.根据权利要求1所述的基于多尺度注意力的原型适配网络的机械设备故障诊断方
法, 其特征在于, 所述 步骤S43为测试集未知样本分配伪标签, 表示 为:
式中:
表示输入的测试集样本;
表示样本
的预测标签; Xt表示测试数据集; 通过计
算测试集无标注样本与训练集原型 的相似度, 为测试集样本分配伪标签, 获取伪标签测试
数据集
4.根据权利要求1所述的基于多尺度注意力的原型适配网络的机械设备故障诊断方
法, 其特征在于, 所述 步骤S44中的伪原型表示
计算表示 为:
式中:
为测试集中第c类样本, f(*)表示编码网络的前向计算过程; 为确保能够自适权 利 要 求 书 2/3 页
3
CN 115508073 A
3
专利 基于多尺度注意力的原型适配机械设备故障诊断方法
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:20上传分享