全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111302425.4 (22)申请日 2021.11.04 (71)申请人 北京有竹居网络技 术有限公司 地址 101299 北京市平谷区林荫北街13号 信息大厦802 (72)发明人 范湉湉 黄灿 王长虎  (74)专利代理 机构 北京信远 达知识产权代理有 限公司 1 1304 代理人 赵晓荣 (51)Int.Cl. G06V 30/10(2022.01) G06V 30/413(2022.01) G06N 20/00(2019.01) (54)发明名称 一种字符识别方法、 装置、 设备、 介质及产品 (57)摘要 本申请提供了一种字符识别方法、 装置、 设 备及介质, 该方法包括: 电子设备获取待识别的 图像, 通过包括编码器和解码器的字符识别模型 对该图像进行识别, 获的识别结果序列。 其中解 码器的损失函数包括自回归解码损失函数和生 成对抗损失函数, 生成对抗损失函数根据判别器 获得, 判别器用于在字 符识别模 型的训练中对于 输出结果进行判别, 以提高字 符识别模型的识别 精度, 并且 避免训练数据的暴露。 权利要求书2页 说明书11页 附图5页 CN 114037990 A 2022.02.11 CN 114037990 A 1.一种字符识别方法, 其特 征在于, 所述方法包括: 获取待识别的图像; 通过字符识别模型对所述图像进行识别, 获得识别结果序列; 其中, 所述字符识别模型 包括编码器和解码器, 所述解码 器的损失函数包括自回归解码损失函数和生成对抗损失函 数; 利用判别器对所述识别结果序列进行判别, 当判别通过时, 输出 所述识别结果序列。 2.根据权利要求1所述的方法, 其特征在于, 所述字符识别模型通过如下方式训练得 到: 将训练数据输入所述字符识别模型, 获得 所述训练数据中训练图像的识别结果序列; 将所述识别结果序列和所述训练数据中标签序列的编码特征以及所述字符识别模型 中编码器的编码特 征输入判别器, 获得判别结果; 根据所述识别结果序列、 所述标签序列和所述自回归解码损 失函数, 确定自回归解码 损失值, 根据所述识别结果序列、 所述判别结果和所述生 成对抗损失函数, 确定生成对抗损 失值; 根据所述自回归解码损失值和所述 生成对抗损失值更新所述字符识别模型的参数。 3.根据权利要求2所述的方法, 其特征在于, 所述解码器以字符为单位进行解码, 所述 判别器以句子为单位进行判别。 4.根据权利要求1至3任一项所述的方法, 其特征在于, 所述生成对抗损 失函数为交叉 熵损失函数。 5.一种字符识别装置, 其特 征在于, 所述装置包括: 通信模块, 用于获取待识别的图像; 识别模块, 用于通过字符识别模型对所述图像进行识别, 获得识别结果序列; 其中, 所 述字符识别模型包括编 码器和解码器, 所述解码 器的损失函数包括自回归解码损失函数和 生成对抗损失函数; 判别模块, 用于利用判别器对所述识别结果序列进行判别, 当判别通过时, 输出所述识 别结果序列。 6.根据权利要求5所述的装置, 其特征在于, 所述字符识别模型通过如下方式训练得 到: 将训练数据输入所述字符识别模型, 获得 所述训练数据中训练图像的识别结果序列; 将所述识别结果序列和所述训练数据中标签序列的编码特征以及所述字符识别模型 中编码器的编码特 征输入判别器, 获得判别结果; 根据所述识别结果序列、 所述标签序列和所述自回归解码损 失函数, 确定自回归解码 损失值, 根据所述识别结果序列、 所述判别结果和所述生 成对抗损失函数, 确定生成对抗损 失值; 根据所述自回归解码损失值和所述 生成对抗损失值更新所述字符识别模型的参数。 7.根据权利要求6所述的装置, 其特征在于, 所述解码器以字符为单位进行解码, 所述 判别器以句子为单位进行判别。 8.根据权利要求5至7任一项所述的装置, 其特征在于, 所述生成对抗损 失函数为交叉 熵损失函数。权 利 要 求 书 1/2 页 2 CN 114037990 A 29.一种电子设备, 其特 征在于, 包括: 存储装置, 其上存 储有计算机程序; 处理装置, 用于执行所述存储装置中的所述计算机程序, 以实现权利要求1至4中任一 项所述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理装 置执行时实现权利要求1至4中任一项所述方法的步骤。 11.一种计算机程序产品, 其特征在于, 当所述计算机程序产品在计算机上运行时, 使 得计算机执 行如权利要求1至4中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114037990 A 3

.PDF文档 专利 一种字符识别方法、装置、设备、介质及产品

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种字符识别方法、装置、设备、介质及产品 第 1 页 专利 一种字符识别方法、装置、设备、介质及产品 第 2 页 专利 一种字符识别方法、装置、设备、介质及产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:00:04上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。