专利模型的训练方法和装置、电子设备、存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210361407.1 (22)申请日 2022.04.07 (71)申请人平安科技（深圳）有限公司地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 (72)发明人司世景　王健宗　叶童　 (74)专利代理机构广州嘉权专利商标事务所有限公司 4 4205 专利代理师廖慧贤 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/30(2020.01) G06V 10/774(2022.01) G06K 9/62(2022.01) (54)发明名称模型的训练方法和装置、电子设备、存储介质 (57)摘要本申请实施例提供了一种模型的训练方法和装置、电子设备、存储介质，属于人工智能技术领域。方法包括：获取原始图像数据；对原始图像数据进行数据增强，得到初步训练数据；根据初步训练数据对预设的原始编码模型进行自训练处理，得到实体编码模型；将标签样本输入至实体编码模型进行有监督训练，得到初级识别模型；通过初级识别模型对无标签样本进行预测处理，得到网络标签数据，将网络标签数据添加至标签样本，得到目标标签集；根据初步训练数据和目标标签集构造相对熵损失函数、交叉熵损失函数；根据交叉熵损失函数、相对熵损失函数和预设的权重函数更新初级识别模型的参数，得到目标模型。本申请实施例的技术方案，提高了数据标注的准确性。权利要求书2页说明书14页附图4页 CN 114722826 A 2022.07.08 CN 114722826 A 1.一种模型的训练方法，其特征在于，所述训练方法包括：获取原始图像数据；其中，所述原始图像数据包括标注图像数据和未标注图像数据；对所述原始图像数据进行数据增强，得到初步训练数据；其中，所述初步训练数据包括标签样本和无标签样本，所述标签样本对应所述标注图像数据，所述无标签样本对应所述无标注图像数据；根据所述初步训练数据对预设的原始编码模型进行自训练处理，得到实体编码模型；将所述标签样本输入至所述实体编码模型进行有监督训练，得到初级识别模型；通过所述初级识别模型对所述无标签样本进行预测处理，得到网络标签数据，并将所述网络标签数据添加至所述标签样本，得到目标标签集；根据所述目标标签集构造交叉熵损失函数；根据所述初步训练数据和所述目标标签集构造相对熵损失函数；根据所述交叉熵损失函数、所述相对熵损失函数和预设的权重函数对所述初级识别模型的参数进行更新处理，得到目标模型；其中，所述目标模型为命名实体识别模型，所述命名实体识别模型用于对未标注的目标图像数据进行标注。 2.根据权利要求1所述的方法，其特征在于，所述对所述原始图像数据进行数据增强，得到初步训练数据，包括：将所述原始图像数据输入至dropout编码器进行数据增强处理，得到第一增强数据；将所述初步增强数据输入至dropout编码器进行数据增强处理，得到第二增强数据；根据所述第一增强数据和所述第二增强数据，得到所述初步训练数据。 3.根据权利要求1所述的方法，其特征在于，所述根据所述初步训练数据对预设的原始编码模型进行自训练处理，得到实体编码模型，包括：根据所述原始编码模型对所述初步训练数据进行特征提取，得到特征训练数据；根据所述特征训练数据构建对比损失函数；根据所述对比损失函数更新所述原始编码模型，得到所述实体编码模型。 4.根据权利要求3所述的方法，其特征在于，所述根据所述原始编码模型对所述初步训练数据进行特征提取，得到特征训练数据，包括：通过所述原始编码模型对所述初步训练数据进行编码处理，得到编码训练数据；对所述编码训练数据进行映射处理，得到所述特征训练数据。 5.根据权利要求4所述的方法，其特征在于，所述对所述编码训练数据进行映射处理，得到所述特征训练数据，包括：获取预设的激活函数；将所述编码训练数据进行全连接处理，得到全连接训练数据；根据所述激活函数对所述全连接训练数据进行激活处理，得到激活训练数据；对所述激活训练数据进行全连接处理，得到所述特征训练数据。 6.根据权利要求1至5任意一项所述的方法，其特征在于，所述根据所述交叉熵损失函数、所述相对熵损失函数和预设的权重函数对所述初级识别模型的参数进行更新处理，得到目标模型，包括：对所述权重函数和所述相对熵函数进行求积，计算得到目标熵函数；对所述目标熵函数和所述交叉熵函数进行求和，计算得到目标损失函数；权　利　要　求　书 1/2 页 2 CN 114722826 A 2根据所述目标损失函数对所述初级识别模型的参数进行更新处理，得到所述目标模型。 7.根据权利要求6所述的方法，其特征在于，所述根据所述目标损失函数对所述初级识别模型的参数进行更新处理，得到所述目标模型，包括：以所述目标损失函数最小化为目标，对所述初级识别模型进行循环迭代处理，以更新所述初级识别模型的参数，得到所述目标模型。 8.一种模型的训练装置，其特征在于，所述模型的训练装置包括：数据获取模块，用于获取原始图像数据；其中，所述原始图像数据包括标注图像数据和未标注图像数据；数据增强模块，用于对所述原始图像数据进行数据增强，得到初步训练数据；其中，所述初步训练数据包括标签样本和无标签样本，所述标签样本对应所述标注图像数据，所述无标签样本对应所述无标注图像数据；自训练模块，用于根据所述初步训练数据对预设的原始编码模型进行自训练处理，得到实体编码模型；监督训练模块，用于将所述标签样本输入至所述实体编码模型进行有监督训练，得到初级识别模型；预测处理模块，用于通过所述初级识别模型对所述无标签样本进行预测处理，得到网络标签数据，并将所述网络标签数据添加至所述标签样本，得到目标标签集；第一构造模块，用于根据所述目标标签集构造交叉熵损失函数；第二构造模块，用于根据所述初步训练数据和所述目标标签集构造相对熵损失函数；参数更新模块，用于根据所述交叉熵损失函数、所述相对熵损失函数和预设的权重函数对所述初级识别模型的参数进行更新处理，得到目标模型；其中，所述目标模型为命名实体识别模型，所述命名实体识别模型用于对未标注的目标图像数据进行标注。 9.一种电子设备，其特征在于，所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线，所述程序被所述处理器执行时实现如权利要求1至7任一项所述的模型的训练方法的步骤。 10.一种存储介质，所述存储介质为计算机可读存储介质，用于计算机可读存储，其特征在于，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现权利要求1至7中任一项所述的模型的训练方法的步骤。权　利　要　求　书 2/2 页 3 CN 114722826 A 3

专利 模型的训练方法和装置、电子设备、存储介质

专利模型的训练方法和装置、电子设备、存储介质