全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210718514.5 (22)申请日 2022.06.23 (71)申请人 征图新视 (江苏) 科技股份有限公司 地址 213161 江苏省常州市经开区西太湖 锦华路258- 6号 (72)发明人 都卫东 和江镇 张中信 龙仕玉  (74)专利代理 机构 常州品益专利代理事务所 (普通合伙) 32401 专利代理师 王涵江 (51)Int.Cl. G06V 30/18(2022.01) G06V 30/19(2022.01) G06V 30/166(2022.01) G06V 10/32(2022.01) G06V 10/44(2022.01)G06V 10/764(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 工业OCR喷墨字符识别方法 (57)摘要 本发明涉及一种工业OCR喷墨字符识别方 法, 包括步骤S1、 收集并制作OCR识别数据集; S2、 采用字符打乱方式对数据集进行扩充; S3、 对输 入的图片数据进行归一化; S4、 搭建带有空间注 意力机制的CRNN模型; S5、 设置模型的超参数进 行模型的训练; S6、 分析实验的结果, 如果准确率 没有达到 预期, 则重新调整超参数, 并重新训练; 如果准确率已经达到预期, 则结束训练。 本发明 采用字符打乱的方式快速扩充喷墨字符数据集 的数量, 减少了人工收集数据和标注数据的工作 量, 平衡了字符样本的数量; 采用空间注意力机 制使得卷积神经网络更加关注字符区域的特征, 减少背景区域的干扰, 对模糊的字符也能具有较 高的识别准确率。 权利要求书2页 说明书6页 附图3页 CN 115205867 A 2022.10.18 CN 115205867 A 1.一种工业OCR喷墨字符识别方法, 其特 征在于: 包括以下步骤, S1、 收集并制作OCR识别数据集, 每一张字符样本图片中仅包含一行的文字, 每一张字 符样本图片的标签是图片中出现的这行字符; S2、 对数据集进行扩充, 采用字符打乱的方式扩充数据集中样本的数量并均衡数据集 中的不同字符; 将扩充后的数据集按照比例划分成训练集和验证集, 以供模型 的训练和验 证; S3、 对输入的图片数据进行归一 化; S4、 搭建带有空间注意力机制的CRNN模型; 模型包括8个卷积层, 4个最大池化层, 2个BN 层, 1个激活函数层和2个LSTM层; S5、 设置模型的超参数, 进行模型的训练; S6、 分析实验的结果, 如果准确率没有达到预期, 则重新调整超参数, 并重新训练; 如果 准确率已经达 到预期, 则结束训练。 2.如权利要求1所述的工业OCR喷墨字符识别方法, 其特征在于: 所述的步骤S1中, OCR 识别数据集的制作方式是将图片的路径与其对应的标签写入txt文件中, 构建一个 OCR识别 数据集。 3.如权利 要求1所述的工业OCR喷墨字符识别方法, 其特征在于: 所述的步骤S2中, 对数 据集进行扩充包括以下步骤, 1)计算每一个字符样本图片的标签的长度; 2)根据每一个字符样本图片的标签长度, 将字符样本图片在水平方向上等分成若干 份, 每一份称为子 字符; 3)将每一个子 字符的位置进行随机的打乱; 4)将打乱后的子 字符拼接成一个新的字符样本图片; 5)修改新的字符样本图片的标签, 标签即为 新的字符样本图片出现的字符串。 4.如权利 要求1所述的工业OCR喷墨字符识别方法, 其特征在于: 所述的步骤S3中, 归一 化按照如下的公式进行: 其中, Xi是输入特征, X'i是输出特征, Xmax是输入特征的最大值, Xmin是输入特征的最小 值。 5.如权利 要求1所述的工业OCR喷墨字符识别方法, 其特征在于: 所述的步骤S4中, 输入 图片送入模 型后, 经过2个CM模块, 一个C2M模块, 2个CB模块, 一个最大池化层, 一个卷积层, 一个序列层, 2个LSTM层, 1个转译层后输出; 所述的CM模块由一个3 ×3卷积层和一个最大池 化层组成; 所述的C2M模块由2个3 ×3卷积层、 一个空间注 意力层和一个最大池化层组成; 所 述的CB模块由一个3 ×3的卷积层和BN层组成。 6.如权利要求5所述的工业OCR喷墨字符识别方法, 其特征在于: 所述的空间注意力层 用来重点关注字 符特征信息, 具体做法是: 输入 特征是C×H×W, C代表特征的通道数, H代表 特征的高, W代表特征的宽; 在维度C上使用平均池化, 得到1 ×H×W的特征; 使用1 ×1的卷积 对这个1×H×W的特征进行卷积, 得到的特征维度是1 ×H×W; 使用sigmoid激活函数将1 ×H ×W的特征每一个位置的值映射到[ 0,1], 得到一个1 ×H×W的特征, 此时每一个位置的值代权 利 要 求 书 1/2 页 2 CN 115205867 A 2表每一个位置的重要程度; 将sigmoid函数的输出结果与 原始的输入 特征点乘, 得到输出特 征, 维度是C ×H×W; Sigmoid激活函数的公式如下: 其中, x代 表函数的输入, S(x)代 表函数的输出。权 利 要 求 书 2/2 页 3 CN 115205867 A 3

PDF文档 专利 工业OCR喷墨字符识别方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 工业OCR喷墨字符识别方法 第 1 页 专利 工业OCR喷墨字符识别方法 第 2 页 专利 工业OCR喷墨字符识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:43:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。