全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111669615.X (22)申请日 2021.12.31 (71)申请人 济南信通达电气科技有限公司 地址 250101 山东省济南市高新区齐盛广 场1号楼1712室 (72)发明人 帅民伟 蔡富东 吕昌峰 刘焕云  杨胜男 杨冲  (74)专利代理 机构 北京君慧知识产权代理事务 所(普通合伙) 11716 专利代理师 董延丽 (51)Int.Cl. G06T 5/00(2006.01) G06T 5/20(2006.01) G06T 7/11(2017.01) G06T 7/62(2017.01)G06T 7/90(2017.01) G06V 30/148(2022.01) G06V 20/52(2022.01) G06K 9/62(2022.01) G06V 10/74(2022.01) G06V 10/774(2022.01) (54)发明名称 一种用于电力设备的文本识别方法及设备 (57)摘要 本申请提供了一种用于电力设备的文本识 别方法及设备, 该方法获取设备监拍图像, 通过 预设的文本检测模型, 确定设备监拍图像的文本 区域。 其中, 文本检测模型通过若干电力设备样 本图训练得到。 电力设备样本图基于预先确定的 电力设备标注图以及电力领域文本集生成。 电力 设备标注 图为标注电力设备表面的文本信息的 图像。 将文本区域相应的区域图像, 输入预设的 文本识别模型, 以确定区域图像中的文本信息。 其中, 文本识别模型通过预设处理后的若干文本 区域图像训练得到。 预设处理为文本识别模型将 各文本区域图像遮挡处理。 文本区域图像根据电 力设备样本图得到。 根据文本信息, 生成设备监 拍图像相应的标注图像。 其中, 标注图像包括标 注的文本信息 。 权利要求书3页 说明书10页 附图5页 CN 114463197 A 2022.05.10 CN 114463197 A 1.一种用于电力设备的文本识别方法, 其特 征在于, 所述方法包括: 获取设备监拍图像; 通过预设的文本检测模型, 确定所述设备监拍图像的文本区域; 其中, 所述文本检测模 型通过若干电力设备样本图训练得到; 所述电力设备样本图基于预先确定的电力设备标注 图以及电力领域文本集生成; 所述电力设备标注图为标注电力设备表面的文本信息的图 像; 将所述文本区域相应的区域图像, 输入预设的文本识别模型, 以确定所述区域图像中 的文本信息; 其中, 所述文本识别模型通过预设处理后的若干文本区域图像训练得到; 所述 预设处理为所述文本识别模型将各所述文本区域图像遮挡处理; 所述文本区域图像根据所 述电力设备样本图得到; 根据所述文本信 息, 生成所述设备监拍图像相应的标注图像; 其中, 所述标注图像包括 标注的所述文本信息 。 2.根据权利要求1所述方法, 其特征在于, 通过预设的文本检测模型, 确定所述设备监 拍图像的文本区域之前, 所述方法还 包括: 通过互联网爬虫软件, 获取若干电力领域词汇; 其中, 所述电力领域词汇为爬取若干电 力专业词汇得到的; 通过预设的开源字体库, 对各所述电力领域词汇进行字体处理; 所述字体处理为将所 述电力领域词汇的字体属 性进行随机设置; 所述字体属 性至少包括以下一项或多项: 字体 大小、 笔画宽度、 字体间距; 根据字体处 理后的各 所述电力领域词汇与数码管字体集, 生成所述电力领域文本集。 3.根据权利要求1所述方法, 其特征在于, 通过预设的文本检测模型, 确定所述设备监 拍图像的文本区域之前, 所述方法还 包括: 确定各所述电力设备标注图中, 标注的所述文本区域图像的前景图像的图像特征, 为 第一特征; 所述前 景图像为所述文本区域图像中的文本; 确定所述电力设备 标注图中背景图像的图像特 征, 为第二特 征; 将所述电力领域文本集中各电力文本, 与各所述第一特征进行随机匹配, 得到随机文 本图像集 合; 将所述随机文本图像集合中的各文本图像与各所述第二特征相应的背景图像进行随 机组合, 生成所述电力设备样本图。 4.根据权利要求1所述方法, 其特征在于, 通过预设的文本检测模型, 确定所述设备监 拍图像的文本区域, 具体包括: 将所述设备监拍图像, 进行双边滤波处 理, 得到边 缘保存图像; 通过颜色空间转换算法, 将所述边缘保存图像转换至HSV颜色空间; 其中, 所述颜色空 间转换算法用于将RGB色彩模式与所述HSV颜色空间进行转换; 通过限制对比度自适应直方图均衡CLAHE算法, 将转换至所述HSV颜色空间的所述边缘 保存图像的亮度分量, 进行对比度处理, 得到预处理图像; 其中, 所述对比度处理用于调整 所述边缘保存图像的背景与文本的对比度; 通过所述颜色空间转换算法, 将所述预处理图像转换至所述RGB色彩模式, 以将所述 RGB色彩模式的所述预处理图像输入所述文本检测模型, 确定所述设备监拍图像的文本区权 利 要 求 书 1/3 页 2 CN 114463197 A 2域。 5.根据权利要求1所述方法, 其特征在于, 所述文本识别模型将各所述文本区域图像遮 挡处理, 具体包括: 根据所述文本区域图像, 确定所述文本区域图像中文本序列; 所述文本序列根据所述 文本区域图像中的文本 字符数量 生成; 确定所述文本序列中的各待遮挡文本; 其中, 所述待遮挡文本至少包括所述文本序列 相应的一个文本 字符; 将所述文本区域图像中, 各所述待遮挡文本相应的区域依次进行遮挡, 得到遮挡文本 区域图像, 直至所述文本区域图像的各区域完成遮挡处 理。 6.根据权利要求1所述方法, 其特征在于, 将所述文本区域相应的区域图像, 输入预设 的文本识别模型, 以确定所述区域图像中的文本信息, 具体包括: 通过所述文本识别模型, 对所述区域图像进行卷积处理, 得到所述区域图像相应的特 征向量; 根据注意力机制, 将所述区域图像输入所述文本识别模型的注意力层, 得到所述区域 图像的若干注意力图; 将各所述注意力图相应向量与所述特征向量进行点乘运算, 并将所述点乘运算的运算 结果输入所述文本识别模型的全连接层, 得到所述区域图像相应的所述文本信息 。 7.根据权利要求1所述方法, 其特征在于, 根据所述文本信息, 生成所述设备监拍图像 相应的标注图像, 具体包括: 确定所述设备监拍图像中所述文本信息的位置数据; 根据所述位置数据, 确定与所述文本信 息匹配的文本标注框; 其中, 所述匹配为位置及 所占图像区域 面积匹配; 根据所述设备监拍图像的面积, 生成所述文本信息相应的标注文本; 其中, 所述标注文 本为所述文本信息的文本, 所述标注文本的字体比例与所述设备监拍图像的面积满足预设 规则; 所述预设规则根据预设的字体比例对照表得到; 将所述标注文本添加至所述文本标注框的预设位置, 生成所述设备监拍图像相应的标 注图像。 8.根据权利要求7所述方法, 其特征在于, 根据所述设备监拍图像的面积, 生成所述文 本信息相应的标注文本, 具体包括: 将所述文本信息以及标注文本 选定信息发送至用户终端; 基于用户在预设时间内对所述用户终端的操作, 确定所述用户选定的标注文本的文本 属性, 以根据所述文本属性, 确定所述标注文本; 所述文本属性包括: 字体 类型、 字体颜色。 9.根据权利要求1所述方法, 其特征在于, 根据所述文本信息, 生成所述设备监拍图像 相应的标注图像之后, 所述方法还 包括: 向用户终端发送标注确认信息; 其中, 所述标注确认信息用于确认所述标注图像相应 的标注的所述文本信息是否准确; 根据所述用户终端的反馈信息, 确定所述标注图像相应的所述文本信息是否准确; 在所述标注图像相应的所述文本信 息不准确的情况下, 确定所述反馈信 息中的标注错 误数据; 其中, 所述标注错误数据用于表征所述标注图像相应的文本区域的错误和/或所述权 利 要 求 书 2/3 页 3 CN 114463197 A 3

.PDF文档 专利 一种用于电力设备的文本识别方法及设备

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用于电力设备的文本识别方法及设备 第 1 页 专利 一种用于电力设备的文本识别方法及设备 第 2 页 专利 一种用于电力设备的文本识别方法及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:43:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。