全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210023481.2 (22)申请日 2022.01.10 (71)申请人 北京有竹居网络技 术有限公司 地址 101299 北京市平谷区林荫北街13号 信息大厦802室 (72)发明人 叶勇杰 黄灿  (74)专利代理 机构 北京英创嘉友知识产权代理 事务所(普通 合伙) 11447 专利代理师 贺晓蕾 (51)Int.Cl. G06V 20/62(2022.01) G06V 30/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 字体识别方法、 装置、 可读介质及电子设备 (57)摘要 本公开涉及一种字体识别方法、 装置、 可读 介质及电子设备, 该字体识别方法通过该预设字 体识别模型将该待识别图像划分为多个子图像, 并获取每个该子图像对应的第一图像特征, 根据 该待识别图像中每个该子图像对应的该第一图 像特征确定该待识别图像对应的第二图像特征, 该第二图像特征包括该待识别图像中每个该子 图像与其他子图像的上下文关联特征, 根据该第 二图像特征确定该目标文本对应的字体类型, 这 样, 能够根据每个字图像与其他子图像的相关性 更全面、 更准确地描述该待识别图像, 从而能够 有效提升字体识别结果的准确性, 也能够有效提 高字体识别率。 权利要求书2页 说明书12页 附图3页 CN 114495080 A 2022.05.13 CN 114495080 A 1.一种字体识别方法, 其特 征在于, 所述方法包括: 获取待识别图像, 所述待识别图像中包括目标文本; 将所述待识别图像输入预设字体识别模型, 以使所述预设字体识别模型输出所述目标 文本对应的字体 类型; 其中, 所述预设字体识别模型, 用于将所述待识别图像划分为多个子图像, 并获取每个 所述子图像对应的第一图像特征, 根据所述待识别图像中每个所述子图像对应的所述第一 图像特征确定所述待识别图像对应的第二图像特征, 所述第二图像特征包括所述待识别图 像中每个所述子图像与其他子图像的上下文关联特征, 根据所述第二图像特征确定所述目 标文本对应的字体 类型。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述第 二图像特征确定所述目标 文本对应的字体 类型, 包括: 获取所述第二图像特征与所述预设字体识别模型对应的多种可识别字体中每种所述 可识别字体对应的代表特征之 间的欧式距离, 以得到所述待识别图像与多种所述可识别字 体的代表特征的多个所述欧式距离; 从多个所述欧式距离中确定最小的目标距离; 根据所述目标距离确定所述待识别图像中目标文本对应的字体 类型。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述目标距离确定所述待识别图 像中目标文本对应的字体 类型, 包括: 在所述目标距离小于预设距离阈值的情况下, 将计算所述目标距离所用目标代表特征 对应的目标字体 类型作为所述目标文本的字体 类型。 4.根据权利要求2所述的方法, 其特征在于, 所述根据所述目标距离确定所述待识别图 像中目标文本对应的字体 类型, 包括: 在确定所述目标距离大于或者等于预设距离阈值的情况下, 确定所述目标文本对应的 字体类型为新增字体。 5.根据权利要求1所述的方法, 其特 征在于, 所述预设字体识别模型还用于: 获取目标新增字体的多个第 一字体识别样本图像, 所述第 一字体识别样本图像包括所 述目标新增字体的指定文本样本; 获取每个所述第一字体识别样本图像对应的第二图像特 征; 获取所述多个第 一字体识别样本图像对应的多个所述第 二图像特征的目标均值, 将所 述目标均值作为所述目标新增字体对应的目标代 表特征, 并存储所述目标代 表特征。 6.根据权利要求5所述的方法, 其特征在于, 所述获取目标新增字体的多个第 一字体识 别样本图像, 包括: 从预设字体 语料库中获取 所述目标新增字体的指定文本样本; 从预设背景库中获取目标背景图像; 将所述指定文本样本和所述目标背景图像合成所述第一字体识别样本图像。 7.根据权利要求1 ‑6任一项所述的方法, 其特征在于, 所述预设字体识别模型通过以下 方式训练得到: 获取多个第 二字体识别样本图像, 多个所述第 二字体识别样本图像包括多种第 一字体 类型的标注数据;权 利 要 求 书 1/2 页 2 CN 114495080 A 2将所述多个第二字体识别样本 图像为第一训练数据集, 对预设初始模型进行预训练, 以得到第一待定模型, 所述预设初始模型包括图像分割初始模块和多头注意力初始模块; 获取多个第 三字体识别样本图像, 多个所述第 三字体识别样本图像包括多种第 二字体 类型的标注数据, 所述第一字体 类型与所述第二字体 类型相同或不同; 将所述多个第三字体识别样本图像为第二训练数据集, 对所述第一待定模型进行训 练, 以得到所述预设字体识别模型。 8.一种字体识别装置, 其特 征在于, 所述装置包括: 获取模块, 被 配置为获取待识别图像, 所述待识别图像中包括目标文本; 确定模块, 被配置为将所述待识别图像输入预设字体识别模型, 以使所述预设字体识 别模型输出 所述目标文本对应的字体 类型; 其中, 所述预设字体识别模型, 用于将所述待识别图像划分为多个子图像, 并获取每个 所述子图像对应的第一图像特征, 根据所述待识别图像中每个所述子图像对应的所述第一 图像特征确定所述待识别图像对应的第二图像特征, 所述第二图像特征包括所述待识别图 像中每个所述子图像与其他子图像的上下文关联特征, 根据所述第二图像特征确定所述目 标文本对应的字体 类型。 9.一种计算机可读介质, 其上存储有计算机程序, 其特征在于, 该程序被处理装置执行 时实现权利要求1 ‑7中任一项所述方法的步骤。 10.一种电子设备, 其特 征在于, 包括: 存储装置, 其上存 储有计算机程序; 处理装置, 用于执行所述存储装置 中的所述计算机程序, 以实现权利要求1 ‑7中任一项 所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114495080 A 3

.PDF文档 专利 字体识别方法、装置、可读介质及电子设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 字体识别方法、装置、可读介质及电子设备 第 1 页 专利 字体识别方法、装置、可读介质及电子设备 第 2 页 专利 字体识别方法、装置、可读介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:16:53上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。