全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210062161.8 (22)申请日 2022.01.19 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518000 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 林庆祥 郭春超 王红法 刘威  (74)专利代理 机构 北京市立方律师事务所 11330 代理人 张筱宁 (51)Int.Cl. G06V 10/24(2022.01) G06V 10/26(2022.01) G06V 10/44(2022.01) G06V 10/422(2022.01) G06V 10/74(2022.01) (54)发明名称 图像处理方法、 装置、 计算机设备、 存储介质 及程序产品 (57)摘要 本申请提供一种图像处理方法、 装置、 计算 机设备、 存储介质及程序产品, 涉及人工智能、 计 算机视觉、 云计算技术领域。 通过对待视角校正 的文本图像提取边缘图和分割图; 并基于边缘图 所指示的边缘位置的边缘点, 以精确到点的精度 筛选出至少两个候选多边形; 并进一步结合分割 图, 对该至少两个候选多边形进行筛选, 得到目 标多边形, 以结合分割图所指示的文本区域, 从 文本边缘的几种候选中精确圈定文本的边缘, 即 使是复杂多变的场景也同样适用, 提高图像处理 过程的实用性和准确性。 基于目标多边形和目标 尺寸对文本图像进行透视变换, 得到视角校正后 的目标图像; 通过对边缘图和分割图的结合提高 文本边缘的精度, 提高图像处理的准确性和实用 性。 权利要求书2页 说明书18页 附图5页 CN 114399626 A 2022.04.26 CN 114399626 A 1.一种图像处 理方法, 其特 征在于, 所述方法包括: 对待视角校正的文本 图像提取边缘图和分割图, 所述文本 图像包括透视变形的文本, 所述边缘图用于指示所述文本图像中文本的边缘位置, 所述分割图用于指示所述文本图像 中文本所在区域; 基于所述 边缘图所指示的边 缘位置的边 缘点, 确定至少两个候选多边形; 基于所述分割图, 确定所述至少两个候选多边形中的目标多边形; 基于所述目标多边形以及目标尺寸, 对所述文本 图像进行透视变换, 得到视角校正后 的目标图像。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述分割图, 确定所述至少两个 候选多边形中的目标多边形, 包括: 根据所述分割图中文本所在区域, 确定每个候选多边形中的分割图区域所占比例, 所 述分割图区域是指候选多边形中属于所述文本所在区域的区域; 基于所述每个候选多边形中的分割图区域所占比例、 以及所述每个候选多边形的面 积, 从所述至少两个候选多边形中筛 选出符合目标 条件的目标多边形。 3.根据权利要求1所述的方法, 其特征在于, 所述基于所述目标多边形以及目标尺寸, 对所述文本图像进行透 视变换, 得到 视角校正后的目标图像, 包括: 基于所述文本 图像与所述边缘图之间的缩放倍数, 对所述目标多边形进行放大, 并基 于放大后的目标多边形, 预估所述文本的目标尺寸; 基于所述 放大后的目标多边形以及所述目标尺寸, 确定 透视变换矩阵; 基于所述透 视变换矩阵, 对所述文本图像进行透 视变换, 得到所述目标图像。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述放大后的目标多边形以及所 述目标尺寸, 确定 透视变换矩阵, 包括: 获取所述放大后的目标多边形在所述文本图像的图像坐标系的第一顶点 位置; 获取所述目标尺寸的区域在所述图像坐标系的第二顶点 位置; 基于所述第一顶点 位置和所述第二顶点 位置, 确定所述透 视变换矩阵。 5.根据权利要求1所述的方法, 其特征在于, 所述边缘图和分割图是通过目标模型获 取, 所述目标模型的训练方式, 包括: 通过初始模型, 提取样本 图像的样本边缘图和样本分割图, 所述样本 图像的真值标签 包括所述样本图像的真值 边缘图和真值分割图; 基于第一平衡参数和边缘提升参数, 确定所述样本边缘图和所述真值边缘图之间的第 一差异, 所述第一平衡参数用于平衡所述样本图像中边缘位置与非边缘位置之间的比例, 所述边缘提升参数用于增大所述第一差异中边缘位置差异的比重, 所述边缘位置差异是指 所述样本边 缘图中预测边 缘位置和所述真值 边缘图中边 缘位置之间的差异; 基于第二平衡参数, 确定所述样本分割图与所述真值分割图之间的第二差异, 所述第 二平衡参数用于平衡所述样本图像中文本区域与非文本区域之间的比例; 基于所述第一差异和所述第二差异, 对所述初始模型进行训练, 得到所述目标模型。 6.根据权利要求5所述的方法, 其特征在于, 所述基于第一平衡参数和边缘提升参数, 确定所述样本边 缘图和所述真值 边缘图之间的第一差异, 包括: 确定所述样本边缘图中预测边缘位置与所述真值边缘图中边缘位置之间的第一相似权 利 要 求 书 1/2 页 2 CN 114399626 A 2度, 以及所述样本边缘图中预测非边缘位置与所述真值边缘图中非边缘位置之 间的第二相 似度; 基于第一平衡参数以及边缘提升参数, 对所述第 一相似度、 第二相似度进行加权处理, 得到所述样本边 缘图和所述真值 边缘图之间的第一差异; 相应的, 所述基于第二平衡参数, 确定所述样本分割图与所述真值分割图之间的第二 差异, 包括: 确定所述样本分割图中预测文本区域与所述真值分割图中文本区域之间的第三相似 度, 以及所述样本 分割图中预测非文本区域与所述真值分割图中非文本区域之 间的第四相 似度; 基于第二平衡参数, 对所述第 三相似度、 第四相似度进行加权处理, 得到所述样本分割 图与所述真值分割图之间的第二差异。 7.根据权利要求1所述的方法, 其特征在于, 所述基于所述边缘图所指示的边缘位置的 边缘点, 确定至少两个候选多边形, 包括: 基于所述 边缘图所指示的边 缘位置的边 缘点, 确定至少两条线段; 基于每条线段在所述边缘图的图像坐标系的斜率和截距, 合并所述至少两条线段中斜 率和截距符合相似条件的线段; 基于合并后的至少两条线段之间的交点, 确定所述至少两个候选多边形。 8.根据权利要求1所述的方法, 其特征在于, 所述基于所述边缘图所指示的边缘位置的 边缘点, 确定至少两个候选多边形之后, 所述方法还 包括: 确定每个候选多边形的宽和高之间的边长 差值; 确定每个候选多边形中相邻边之间的夹角; 基于边长差值和所述夹角, 删除所述至少两个候选多边形中边长差值和夹角不符合第 一条件的候选多边形。 9.一种图像处 理装置, 其特 征在于, 所述装置包括: 提取模块, 用于对待视角校正的文本 图像提取边缘图和分割图, 所述文本 图像包括透 视变形的文本, 所述边缘图用于指示所述文本图像中文本的边缘位置, 所述分割图用于指 示所述文本图像中文本所在区域; 第一确定模块, 用于基于所述边缘图所指示的边缘位置的边缘点, 确定至少两个候选 多边形; 第二确定模块, 用于基于所述分割图, 确定所述至少两个候选多边形中的目标多边形; 透视变换模块, 用于基于所述目标多边形以及目标尺寸, 对所述文本 图像进行透视变 换, 得到视角校正后的目标图像。 10.一种计算机设备, 包括存储器、 处理器及存储在存储器上的计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序以实现权利要求1至8任一项所述方法的步骤。 11.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至8任一项所述方法的步骤。 12.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现权利要求1至8任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114399626 A 3

.PDF文档 专利 图像处理方法、装置、计算机设备、存储介质及程序产品

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像处理方法、装置、计算机设备、存储介质及程序产品 第 1 页 专利 图像处理方法、装置、计算机设备、存储介质及程序产品 第 2 页 专利 图像处理方法、装置、计算机设备、存储介质及程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:16:04上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。