全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210184465.1 (22)申请日 2022.02.25 (71)申请人 中国科学院沈阳自动化研究所 地址 110016 辽宁省沈阳市沈河区南塔街 114号 申请人 沈阳智能机 器人创新中心有限公司   沈阳智能机 器人国家研究院有限公 司 (72)发明人 付生鹏 侯维广 夏仁波 赵吉宾  孙海涛 张诚  (74)专利代理 机构 沈阳科苑专利商标代理有限 公司 210 02 专利代理师 周宇 (51)Int.Cl. G06V 10/26(2022.01)G06V 10/80(2022.01) G06V 10/52(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于改进DeepLabV3+网络的机械零部 件图像分割算法 (57)摘要 本发明涉及一种基于改进DeepLabV3+网络 的机械零部件图像分割算法。 包括: 首先, 在主干 网络中引入注意力机制来提升有效特征信息的 重要性, 增强对零部件目标的学习能力。 其次, 增 加底层特征来源以充分利用特征融合分支进行 自适应学习低级特征的空间信息, 并且将原4倍 上采样操作分解为逐层上采样, 减少了重要像素 信息的丢失。 最后, 使用不对称卷积来增强解码 层中3×3卷积的核骨架部分, 提高了卷积核的处 理能力以及模 型精度。 本发明方法实现了对零部 件图像中的零部件区域的准确分割, 有效弥补了 传统DeepLabV3+对零部件图像分割时存在边缘 分割模糊、 不完全分割的问题, 同时具有一定的 实时性, 提升 工业化效率。 权利要求书2页 说明书6页 附图3页 CN 114627290 A 2022.06.14 CN 114627290 A 1.一种基于改进DeepLabV3+网络的机械零部件图像分割算法, 其特征在于, 包括以下 步骤: 步骤一: 采集原始零部件图像; 对零部件原始图像 中出现的1个或多个零部件边界进行 分割标注得到人工分割图像, 将原 始图像与人工分割图像共同建立 零部件图像数据集; 步骤二: 对零部件图像和人工分割图像分别进行数据增强处理扩充样本 图像, 再按比 例随机划分为训练集、 验证集和 测试集; 步骤三: 搭建改进DeepLabV3+的语义分割模型, 包括编码层和解码层; 编码层包括 MobileNetV2和通道注意力模块、 自适应空间特征融合模块ASFF、 空间金字塔池模块ASPP、 1 ×1卷积模块, 用于将特征图尺寸缩小, 提取信息进行零部件边界分割; 解码层包括1 ×1卷 积模块、 上采样操作、 非对称卷积模块, 用于逐步恢复空间维度, 输出同尺寸的边界分割结 果图; 步骤四: 设置网络训练参数, 将训练集图片输入改进DeepLabV3+的语义分割网络进行 训练, 利用验证集进行验证, 得到优化的网络模型; 步骤五: 利用优化的DeepLabV3+语义分割模型对测试集中的零部件图像进行识别预 测, 得到机械零部件分割结果图。 2.根据权利要求1所述的一种基于改进DeepLabV3+网络的机械零部件图像分割算法, 其特征在于, 所述数据增强包括旋转、 平 移和添加噪声操作。 3.根据权利要求2所述的一种基于改进DeepLabV3+网络的机械零部件图像分割算法, 其特征在于, 所述旋转包括水平翻转、 垂直翻转、 ±60°、±90°、±210°、±240°的旋转; 所述 平移包括右移100像素、 下移100像素; 以及添加0.001,0.002,0.003的椒盐噪声; 最后将增 强后的数据集样本按8: 1: 1的比例随机划分为训练集、 验证集和 测试集。 4.根据权利要求1所述的一种基于改进DeepLabV3+网络的机械零部件图像分割算法, 其特征在于, 所述MobileNetV2和通道注意力模块, 将输入的样本图像进行处理, 输出原图 1/4大小的底层特征图、 三个不同大小的特征层 级图以及原图1/16大小的高层语义特征图; 其中三个不同大小的特征层 级图输入到ASFF模块后输出融合特征图至解码层; 高层语义特 征输入到ASPP结构中, 并行经过1 ×1卷积, 空洞率为6, 12, 18的空洞卷积继续提取特征以及 全局平均池化后对特征图进行融合再输出至1 ×1卷积模块, 得到的高层语义特征图进入解 码层; 所述编码层输出的底层特征图经过1 ×1卷积后与ASFF融合特征图进行相加操作; 然后 与编码层获得的高层语义特征图进行逐层2倍双线性插值上采样后的特征图进行融合操 作; 之后对融合后的特征图采用非对称卷积, 再经过逐层2 倍上采样操作后输出最 终的分割 预测结果图。 5.根据权利要求4所述的一种基于改进DeepLabV3+网络的机械零部件图像分割算法, 其特征在于, 所述ASF F模块进行处 理的步骤 包括: 以三个不同大小的特征层级图为输入, 分别记为x1, x2, x3, 通过3 ×3卷积进行下采样 操作将特 征层级x2和x3调整与x1的大小相同; 对尺寸调整后的特征层级图x1, x2, x3按照 融合特征公式来自适应学习各空间权重信 息, 得到融合特 征图yl; 所述l级融合特 征公式如下:权 利 要 求 书 1/2 页 2 CN 114627290 A 2其中, 表示输出特征图yl的第(i,j)特征向量, 表示不同的三个层级 到l级的空间重要性权重, 且该权重信息共享于所有通道, 表示为m级调整到l级的特征 映射上位置(i,j)处的特 征向量。 6.根据权利要求1所述的一种基于改进DeepLabV3+网络的机械零部件图像分割算法, 其特征在于, 所述逐层2倍双线性插值上采样替换原4倍上采样用于像素的连续性, 减少 重 要像素信息的丢失。 7.根据权利要求1所述的一种基于改进DeepLabV3+网络的机械零部件图像分割算法, 其特征在于, 所述非对称卷积模块包含3 ×3, 1×3, 3×1卷积, 对于第j个卷积核, 令F(j), 和 分别表示3 ×3, 1×3和3×1卷积核的输出 结果, 最终融合的结果 可表示为: 式中, 分别对应3 ×3, 1×3, 3×1卷积的标准偏差值, 和 分别是3×3, 1×3, 3×1卷积的缩放系数和偏移量, bj表示偏置, 公式为: 式中, 是3×3, 1×3, 3×1卷积的批量归一化的通道平均值, 故即可得到以 下非对称卷积融合公式: 式中, 分别表示原始含3 ×3, 1×3和3×1三个分支的输出, *表示二 维卷积算子, M:,:,k是M第k个通道上尺寸为U ×V的特征图, 表示融合后作用于第k个通 道上的卷积核j, C表示 通道数。 8.根据权利要求1所述的一种基于改进DeepLabV3+网络的机械零部件图像分割算法, 其特征在于, 所述网络训练参数包括: 训练次数epoch设为100, 初始学习率设为0.007, 学习 策略采用“poly”, Batchsize设置为2, 初始动量为0.9, 使用交叉熵损失函数, 同时选择随机 梯度下降优化 算法进行训练。权 利 要 求 书 2/2 页 3 CN 114627290 A 3

.PDF文档 专利 一种基于改进DeepLabV3+网络的机械零部件图像分割算法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于改进DeepLabV3+网络的机械零部件图像分割算法 第 1 页 专利 一种基于改进DeepLabV3+网络的机械零部件图像分割算法 第 2 页 专利 一种基于改进DeepLabV3+网络的机械零部件图像分割算法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:16:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。