全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210074380.8 (22)申请日 2022.01.21 (71)申请人 北京有竹居网络技 术有限公司 地址 101299 北京市平谷区林荫北街13号 信息大厦802室 (72)发明人 毛晓飞 黄灿  (74)专利代理 机构 北京英创嘉友知识产权代理 事务所(普通 合伙) 11447 代理人 贾会玲 (51)Int.Cl. G06V 20/62(2022.01) G06V 30/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/70(2022.01)G06K 9/62(2022.01) (54)发明名称 图像处理方法、 装置、 可读存储介质及电子 设备 (57)摘要 本公开涉及一种图像处理方法、 装置、 可读 存储介质及电子设备。 方法包括: 对目标图像进 行文本识别, 得到识别文本; 对所述识别文本进 行切分处理; 根据切分处理后所得的文本片段, 通过预先训练好的语言模型对所述识别文本进 行修正, 得到目标文本。 这样, 可以利用语言模型 中的主谓宾搭配以及词语搭配等先验信息实现 文本识别结果的自动修正, 从而保证文本识别结 果的精准度, 以适用于各种复杂识别场景。 另外, 利用语言模型可以实现任意文本识别模型的文 本识别结果的自动修正, 这样, 可 以针对不同的 场景, 选择合适的文本识别模型进行文本识别, 从而提升识别文本的精准度, 从而提升后续识别 文本修正的效率和精准度。 权利要求书2页 说明书12页 附图3页 CN 114429629 A 2022.05.03 CN 114429629 A 1.一种图像处 理方法, 其特 征在于, 包括: 对目标图像进行文本识别, 得到识别文本; 对所述识别文本进行切分处 理; 根据切分处理后所得的文本片段, 通过预先训练好的语言模型对所述识别文本进行修 正, 得到目标文本 。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述识别文本进行切分处理, 包括 以下三种切分方式 中的至少一 者: 将所述识别文本按字符进行切分; 将所述识别文本按照第一预设长度进行切分, 其中, 所述第一预设长度大于1; 根据第二预设长度的滑动 窗口对所述识别文本进行切分, 其中, 所述第二预设长度大 于1。 3.根据权利要求2所述的方法, 其特征在于, 所述对所述识别文本进行切分处理, 包括 所述三种切分方式 中的至少两者; 所述根据切分处理后所得的文本片段, 通过预先训练好的语言模型对所述识别文本进 行修正, 得到目标文本, 包括: 针对每一第 一目标切分方式, 将该第 一目标切分方式切分得到的文本片段输入到预先 训练好的语 言模型中, 得到所述识别文本对应的第一修正文本, 其中, 所述第一目标切分方 式为对所述识别文本进行切分处 理时所采用的切分方式; 根据每一所述第一 修正文本, 生成目标文本 。 4.根据权利要求3所述的方法, 其特征在于, 所述根据每一所述第一修正文本, 生成目 标文本, 包括以下中的任一 者: 将每一所述第一 修正文本中置信度最高者确定为目标文本; 将每一所述第一 修正文本中置信度最高者输入到所述语言模型中, 得到目标文本; 将每一所述第一 修正文本输入到所述语言模型中, 得到目标文本 。 5.根据权利要求1或2所述的方法, 其特征在于, 所述根据切分处理后所得的文本片段, 通过预先训练好的语言模型对所述识别文本进行修 正, 得到目标文本, 包括: 将所述切分处理后所得的文本片段输入到预先训练好的语言模型中, 以对所述识别文 本进行修 正, 得到目标文本 。 6.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 对所述识别文本进行命名实体识别, 得到 至少一个命名实体; 所述根据切分处理后所得的文本片段, 通过预先训练好的语言模型对所述识别文本进 行修正, 得到目标文本, 包括: 根据切分处理后所得的文本片段和所述至少一个命名实体, 通过预先训练好的语言模 型对所述识别文本进行修 正, 得到目标文本 。 7.根据权利要求6所述的方法, 其特 征在于, 所述对所述识别文本进行切分处 理, 包括: 将所述识别文本按字符进行切分; 将所述识别文本按照第一预设长度进行切分, 和/或根据第二预设长度的滑动 窗口对 所述识别文本进行切分, 其中, 所述第一预设长度、 所述第二预设长度均大于1; 所述根据切分处理后所得的文本片段和所述至少一个命名实体, 通过预先训练好的语权 利 要 求 书 1/2 页 2 CN 114429629 A 2言模型对所述识别文本进行修 正, 得到目标文本, 包括: 将按字符进行切分得到的文本片段和所述至少一个命名实体输入到预先训练好的语 言模型中, 得到所述识别文本对应的第二 修正文本; 针对每一第 二目标切分方式, 将该第 二目标切分方式切分得到的文本片段输入到所述 语言模型中, 得到所述识别文本对应的第三修正文本, 其中, 所述第二目标切分方式为对所 述识别文本进 行切分处理 时所采用的、 除所述将所述识别文本按字符进 行切分外的其他切 分方式; 根据所述第二 修正文本和每一所述第三 修正文本, 生成目标文本 。 8.根据权利要求6所述的方法, 其特征在于, 所述根据切分处理后所得的文本片段和所 述至少一个命名实体, 通过预先训练好的语言模型对所述识别文本进行修正, 得到目标文 本, 包括: 将所述切分处理后所得的文本片段和所述至少一个命名实体输入到预先训练好的语 言模型中, 以对所述识别文本进行修 正, 得到目标文本 。 9.根据权利要求2 ‑4、 7中任一项所述的方法, 其特征在于, 所述将所述识别文本按照第 一预设长度进行切分, 包括: 利用N‑gram模型对所述识别文本进行切分, 其中, N 为第一预设长度。 10.一种图像处 理装置, 其特 征在于, 包括: 文本识别模块, 用于对目标图像进行文本识别, 得到识别文本; 切分模块, 用于对所述文本识别模块得到的所述识别文本进行切分处 理; 修正模块, 用于根据所述切分模块切分处理后所得的文本片段, 通过预先训练好的语 言模型对所述识别文本进行修 正, 得到目标文本 。 11.一种计算机可读介质, 其上存储有计算机程序, 其特征在于, 该程序被处理装置执 行时实现权利要求1 ‑9中任一项所述方法的步骤。 12.一种电子设备, 其特 征在于, 包括: 存储装置, 其上存 储有计算机程序; 处理装置, 用于执行所述存储装置 中的所述计算机程序, 以实现权利要求1 ‑9中任一项 所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114429629 A 3

.PDF文档 专利 图像处理方法、装置、可读存储介质及电子设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像处理方法、装置、可读存储介质及电子设备 第 1 页 专利 图像处理方法、装置、可读存储介质及电子设备 第 2 页 专利 图像处理方法、装置、可读存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:16:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。