全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210361407.1 (22)申请日 2022.04.07 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 司世景 王健宗 叶童  (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 专利代理师 廖慧贤 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/30(2020.01) G06V 10/774(2022.01) G06K 9/62(2022.01) (54)发明名称 模型的训练方法和装置、 电子设备、 存储介 质 (57)摘要 本申请实施例提供了一种模型的训练方法 和装置、 电子设备、 存储介质, 属于人工智能技术 领域。 方法包括: 获取原始图像数据; 对原始图像 数据进行数据增强, 得到初步训练数据; 根据初 步训练数据对预设的原始编码模型进行自训练 处理, 得到实体编码模型; 将标签样本输入至实 体编码模型进行有监督训练, 得到初级识别模 型; 通过初级识别模型对无标签样 本进行预测处 理, 得到网络标签数据, 将网络标签数据添加至 标签样本, 得到目标标签集; 根据初步训练数据 和目标标签集构造相对熵损失函数、 交叉熵损失 函数; 根据交叉熵损失函数、 相对熵损失函数和 预设的权重函数更新初级识别模 型的参数, 得到 目标模型。 本申请实施例的技术方案, 提高了数 据标注的准确性。 权利要求书2页 说明书14页 附图4页 CN 114722826 A 2022.07.08 CN 114722826 A 1.一种模型的训练方法, 其特 征在于, 所述训练方法包括: 获取原始图像数据; 其中, 所述原 始图像数据包括标注图像数据和未 标注图像数据; 对所述原始图像数据进行数据增强, 得到初步训练数据; 其中, 所述初步训练数据包括 标签样本和无标签样本, 所述标签样本对应所述标注图像数据, 所述无标签样本对应所述 无标注图像数据; 根据所述初步训练数据对预设的原 始编码模型进行自训练 处理, 得到实体编码模型; 将所述标签样本 输入至所述实体编码模型进行有监 督训练, 得到初级识别模型; 通过所述初级识别模型对所述无标签样本进行预测 处理, 得到网络标签数据, 并将所 述网络标签数据添加至所述标签样本, 得到目标 标签集; 根据所述目标 标签集构造交叉熵损失函数; 根据所述初步训练数据和所述目标 标签集构造相对熵损失函数; 根据所述交叉熵损失函数、 所述相对熵损失函数和预设的权重函数对所述初级识别模 型的参数进行更新处理, 得到目标模型; 其中, 所述 目标模型为命名实体识别模型, 所述命 名实体识别模型用于对未 标注的目标图像数据进行 标注。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述原始图像数据进行数据增强, 得到初步训练数据, 包括: 将所述原 始图像数据输入至dropout编码器进行 数据增强处 理, 得到第一增强数据; 将所述初步增强数据输入至dropout编码器进行 数据增强处 理, 得到第二增强数据; 根据所述第一增强数据和所述第二增强数据, 得到所述初步训练数据。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述初步训练数据对预设的原始 编码模型进行自训练 处理, 得到实体编码模型, 包括: 根据所述原 始编码模型对所述初步训练数据进行 特征提取, 得到特 征训练数据; 根据所述特 征训练数据构建对比损失函数; 根据所述对比损失函数 更新所述原 始编码模型, 得到所述实体编码模型。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述原始编码模型对所述初步训 练数据进行 特征提取, 得到特 征训练数据, 包括: 通过所述原始编码模型对所述初步训练数据进行编码处 理, 得到编码训练数据; 对所述编码训练数据进行映射处 理, 得到所述特 征训练数据。 5.根据权利要求4所述的方法, 其特征在于, 所述对所述编码训练数据进行映射处理, 得到所述特 征训练数据, 包括: 获取预设的激活函数; 将所述编码训练数据进行全连接处 理, 得到全连接训练数据; 根据所述激活函数对所述全连接训练数据进行激活 处理, 得到激活训练数据; 对所述激活训练数据进行全连接处 理, 得到所述特 征训练数据。 6.根据权利要求1至5任意一项所述的方法, 其特征在于, 所述根据所述交叉熵损 失函 数、 所述相对熵损失函数和预设的权重函数对所述初级识别模型 的参数进行更新处理, 得 到目标模型, 包括: 对所述权 重函数和所述相对熵函数进行求积, 计算得到目标熵函数; 对所述目标熵函数和所述交叉熵函数进行求和, 计算得到目标损失函数;权 利 要 求 书 1/2 页 2 CN 114722826 A 2根据所述目标损失函数对所述初级识别模型的参数进行更新处理, 得到所述目标模 型。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述目标损失函数对所述初级识 别模型的参数进行 更新处理, 得到所述目标模型, 包括: 以所述目标损 失函数最小化为目标, 对所述初级识别模型进行循环迭代处理, 以更新 所述初级识别模型的参数, 得到所述目标模型。 8.一种模型的训练装置, 其特 征在于, 所述模型的训练装置包括: 数据获取模块, 用于获取原始图像数据; 其中, 所述原始图像数据包括标注图像数据和 未标注图像数据; 数据增强模块, 用于对所述原始图像数据进行数据增强, 得到初步训练数据; 其中, 所 述初步训练数据包括标签样本和无标签样本, 所述标签样本对应所述标注图像数据, 所述 无标签样本对应所述无 标注图像数据; 自训练模块, 用于根据所述初步训练数据对预设的原始编码模型进行自训练处理, 得 到实体编码模型; 监督训练模块, 用于将所述标签样本输入至所述实体编码模型进行有监督训练, 得到 初级识别模型; 预测处理模块, 用于通过所述初级识别模型对所述无标签样本进行预测 处理, 得到网 络标签数据, 并将所述网络标签数据添加至所述标签样本, 得到目标 标签集; 第一构造模块, 用于根据所述目标 标签集构造交叉熵损失函数; 第二构造模块, 用于根据所述初步训练数据和所述目标 标签集构造相对熵损失函数; 参数更新模块, 用于根据所述交叉熵损 失函数、 所述相对熵损 失函数和预设的权重函 数对所述初级识别模 型的参数进 行更新处理, 得到目标模型; 其中, 所述目标模 型为命名实 体识别模型, 所述命名实体识别模型用于对未 标注的目标图像数据进行 标注。 9.一种电子设备, 其特征在于, 所述电子设备包括存储器、 处理器、 存储在所述存储器 上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通 信的数据总线, 所述程序被所述处理器执行时实现如权利要求1至7任一项所述的模型的训 练方法的步骤。 10.一种存储介质, 所述存储介质为计算机可读存储介质, 用于计算机可读存储, 其特 征在于, 所述存储介质存储有一个或者多个程序, 所述一个或者多个程序可被一个或者多 个处理器执行, 以实现权利要求1至7中任一项所述的模型的训练方法的步骤。权 利 要 求 书 2/2 页 3 CN 114722826 A 3

.PDF文档 专利 模型的训练方法和装置、电子设备、存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型的训练方法和装置、电子设备、存储介质 第 1 页 专利 模型的训练方法和装置、电子设备、存储介质 第 2 页 专利 模型的训练方法和装置、电子设备、存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:51:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。