专利图像处理方法、装置、可读存储介质及电子设备

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210074380.8 (22)申请日 2022.01.21 (71)申请人北京有竹居网络技术有限公司地址 101299 北京市平谷区林荫北街13号信息大厦802室 (72)发明人毛晓飞　黄灿　 (74)专利代理机构北京英创嘉友知识产权代理事务所(普通合伙) 11447 代理人贾会玲 (51)Int.Cl. G06V 20/62(2022.01) G06V 30/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/70(2022.01)G06K 9/62(2022.01) (54)发明名称图像处理方法、装置、可读存储介质及电子设备 (57)摘要本公开涉及一种图像处理方法、装置、可读存储介质及电子设备。方法包括：对目标图像进行文本识别，得到识别文本；对所述识别文本进行切分处理；根据切分处理后所得的文本片段，通过预先训练好的语言模型对所述识别文本进行修正，得到目标文本。这样，可以利用语言模型中的主谓宾搭配以及词语搭配等先验信息实现文本识别结果的自动修正，从而保证文本识别结果的精准度，以适用于各种复杂识别场景。另外，利用语言模型可以实现任意文本识别模型的文本识别结果的自动修正，这样，可以针对不同的场景，选择合适的文本识别模型进行文本识别，从而提升识别文本的精准度，从而提升后续识别文本修正的效率和精准度。权利要求书2页说明书12页附图3页 CN 114429629 A 2022.05.03 CN 114429629 A 1.一种图像处理方法，其特征在于，包括：对目标图像进行文本识别，得到识别文本；对所述识别文本进行切分处理；根据切分处理后所得的文本片段，通过预先训练好的语言模型对所述识别文本进行修正，得到目标文本。 2.根据权利要求1所述的方法，其特征在于，所述对所述识别文本进行切分处理，包括以下三种切分方式中的至少一者：将所述识别文本按字符进行切分；将所述识别文本按照第一预设长度进行切分，其中，所述第一预设长度大于1；根据第二预设长度的滑动窗口对所述识别文本进行切分，其中，所述第二预设长度大于1。 3.根据权利要求2所述的方法，其特征在于，所述对所述识别文本进行切分处理，包括所述三种切分方式中的至少两者；所述根据切分处理后所得的文本片段，通过预先训练好的语言模型对所述识别文本进行修正，得到目标文本，包括：针对每一第一目标切分方式，将该第一目标切分方式切分得到的文本片段输入到预先训练好的语言模型中，得到所述识别文本对应的第一修正文本，其中，所述第一目标切分方式为对所述识别文本进行切分处理时所采用的切分方式；根据每一所述第一修正文本，生成目标文本。 4.根据权利要求3所述的方法，其特征在于，所述根据每一所述第一修正文本，生成目标文本，包括以下中的任一者：将每一所述第一修正文本中置信度最高者确定为目标文本；将每一所述第一修正文本中置信度最高者输入到所述语言模型中，得到目标文本；将每一所述第一修正文本输入到所述语言模型中，得到目标文本。 5.根据权利要求1或2所述的方法，其特征在于，所述根据切分处理后所得的文本片段，通过预先训练好的语言模型对所述识别文本进行修正，得到目标文本，包括：将所述切分处理后所得的文本片段输入到预先训练好的语言模型中，以对所述识别文本进行修正，得到目标文本。 6.根据权利要求1所述的方法，其特征在于，所述方法还包括：对所述识别文本进行命名实体识别，得到至少一个命名实体；所述根据切分处理后所得的文本片段，通过预先训练好的语言模型对所述识别文本进行修正，得到目标文本，包括：根据切分处理后所得的文本片段和所述至少一个命名实体，通过预先训练好的语言模型对所述识别文本进行修正，得到目标文本。 7.根据权利要求6所述的方法，其特征在于，所述对所述识别文本进行切分处理，包括：将所述识别文本按字符进行切分；将所述识别文本按照第一预设长度进行切分，和/或根据第二预设长度的滑动窗口对所述识别文本进行切分，其中，所述第一预设长度、所述第二预设长度均大于1；所述根据切分处理后所得的文本片段和所述至少一个命名实体，通过预先训练好的语权　利　要　求　书 1/2 页 2 CN 114429629 A 2言模型对所述识别文本进行修正，得到目标文本，包括：将按字符进行切分得到的文本片段和所述至少一个命名实体输入到预先训练好的语言模型中，得到所述识别文本对应的第二修正文本；针对每一第二目标切分方式，将该第二目标切分方式切分得到的文本片段输入到所述语言模型中，得到所述识别文本对应的第三修正文本，其中，所述第二目标切分方式为对所述识别文本进行切分处理时所采用的、除所述将所述识别文本按字符进行切分外的其他切分方式；根据所述第二修正文本和每一所述第三修正文本，生成目标文本。 8.根据权利要求6所述的方法，其特征在于，所述根据切分处理后所得的文本片段和所述至少一个命名实体，通过预先训练好的语言模型对所述识别文本进行修正，得到目标文本，包括：将所述切分处理后所得的文本片段和所述至少一个命名实体输入到预先训练好的语言模型中，以对所述识别文本进行修正，得到目标文本。 9.根据权利要求2 ‑4、 7中任一项所述的方法，其特征在于，所述将所述识别文本按照第一预设长度进行切分，包括：利用N‑gram模型对所述识别文本进行切分，其中， N 为第一预设长度。 10.一种图像处理装置，其特征在于，包括：文本识别模块，用于对目标图像进行文本识别，得到识别文本；切分模块，用于对所述文本识别模块得到的所述识别文本进行切分处理；修正模块，用于根据所述切分模块切分处理后所得的文本片段，通过预先训练好的语言模型对所述识别文本进行修正，得到目标文本。 11.一种计算机可读介质，其上存储有计算机程序，其特征在于，该程序被处理装置执行时实现权利要求1 ‑9中任一项所述方法的步骤。 12.一种电子设备，其特征在于，包括：存储装置，其上存储有计算机程序；处理装置，用于执行所述存储装置中的所述计算机程序，以实现权利要求1 ‑9中任一项所述方法的步骤。权　利　要　求　书 2/2 页 3 CN 114429629 A 3

专利 图像处理方法、装置、可读存储介质及电子设备

专利图像处理方法、装置、可读存储介质及电子设备