专利用于训练对比学习模型的方法、装置、设备和介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211351695.9 (22)申请日 2022.10.31 (71)申请人北京有竹居网络技术有限公司地址 101299 北京市平谷区林荫北街13号信息大厦802室 (72)发明人吴昊　周博言　崔权　杨成　 (74)专利代理机构北京世辉律师事务所 16 093 专利代理师李峥宇 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称用于训练对比学习模型的方法、装置、设备和介质 (57)摘要提供了用于训练对比学习模型的方法、装置、设备和介质。在一种方法中，获取用于训练对比学习模型的多个样本集，多个样本集包括第一样本集和第二样本集。按照预定规则，从第一样本集和第二样本集中选择第一目标样本集。按照预定义的批次大小，基于第一目标样本集确定第一组样本。利用第一组样本来训练对比学习模型。以此方式，一方面，可以避免由于样本集偏置导致的对比学习模型性能下降；另一方面，可以缓解训练过程中的遗忘问题。权利要求书3页说明书14页附图7页 CN 115511104 A 2022.12.23 CN 115511104 A 1.一种用于训练对比学习模型的方法，包括：获取用于训练所述对比学习模型的多个样本集，所述多个样本集包括第一样本集和第二样本集；按照预定规则，从所述第一样本集和所述第二样本集中选择第一目标样本集；按照预定义的批次大小，基于所述第一目标样本集确定第一组样本；以及利用所述第一组样本来训练所述对比学习模型。 2.根据权利要求1的所述方法，其中所述预定规则包括以下任一项：随机选择规则、轮询选择规则、基于样本数量的选择规则。 3.根据权利要求1的所述方法，其中按照基于样本数量的选择规则来选择所述目标样本集包括：分别基于所述第一样本集的第一样本数量和所述第二样本集的第二样本数量，确定所述第一样本集的第一权重和所述第二样本集的第二权重；以及基于所述第一权重和所述第二权重，选择所述目标样本集。 4.根据权利要求3的所述方法，其中基于所述第一权重和所述第二权重，选择所述目标样本集包括：基于与所述第一权重和第二权重相关联的分布函数，从所述第一样本集和所述第二样本集中选择目标样本集。 5.根据权利要求1的所述方法，其中所述第一样本集和所述第二样本集中的样本包括第一模态的数据、第二模态的数据、以及表示所述第一模态的数据与所述第二模态的数据之间的关联关系的标签。 6.根据权利要求5的所述方法，其中从所述第一目标样本集中确定所述第一组样本包括：从所述第一目标样本集中选择正样本，所述正样本中的标签指示所述正样本中的第一模态的数据和第二模态的数据之间具有关联关系；以及基于所述正样本中的所述第一模态的数据和所述第一目标样本集中的所述第二模态的数据来生成负样本；以及基于所述正样本和所述负样本来生成所述第一组样本。 7.根据权利要求6的所述方法，其中生成所述负样本包括：从所述第一目标样本集中的第二模态的数据空间中选择第二模态的另一数据；以及基于所述正样本中的所述第一模态的数据和所述第二模态的另一数据，生成所述负样本，所述负样本中的标签指示所述负样本中的第一模态的数据和所述第二模态的另一数据之间不具有关联关系。 8.根据权利要求6的所述方法，其中训练所述对比学习模型包括：针对所述第一组样本中的所述正样本，利用所述对比学习模型来分别确定所述正样本中的所述第一模态的数据的第一特征和所述第二模态的数据的第二特征；基于所述第一特征和所述第二特征之间的差异确定所述对比学习模型的损失函数；以及朝向使得所述损失函数减小的方向更新所述对比学习模型。 9.根据权利要求8的所述方法，其中确定所述第一特征和所述第二特征包括：分别利用权　利　要　求　书 1/3 页 2 CN 115511104 A 2所述对比学习模型中的第一编码器和第二编码器来确定所述第一特征和所述第二特征，所述第一编码器描述所述第一模态的数据与所述第一模态的数据的特征之间的关联关系，以及所述第二编码器描述所述第二模态的数据与所述第二模态的数据的特征之间的关联关系。 10.根据权利要求6的所述方法，其中训练所述对比学习模型包括：针对所述第一组样本中的所述负样本，利用所述对比学习模型来分别确定所述负样本中的所述第一模态的数据的第一特征和所述第二模态的数据的第二特征；基于所述第一特征和所述第二特征之间的差异确定所述对比学习模型的损失函数；以及朝向使得所述损失函数增大的方向更新所述对比学习模型。 11.根据权利要求5的所述方法，其中所述第一模态包括以下多个模态中的任一项：图像、文本、视频、音频，以及所述第二模态包括所述多个模态中的另一项。 12.根据权利要求5的所述方法，进一步包括：从所述第一样本集和所述第二样本集中选择第二目标样本集；按照预定义的批次大小，基于所述第二目标样本集确定第二组样本；以及利用所述第二组样本来训练所述对比学习模型。 13.根据权利要求12的所述方法，其中确定所述第二组样本包括：从所述第二组样本中的未被使用的正样本中选择正样本；基于所述正样本和所述第二目标样本集的第二模态的数据来生成负样本；以及基于所述正样本和所述负样本来确定所述第二组样本。 14.根据权利要求12的所述方法，其中选择所述第一目标样本集独立于选择所述第二目标样本集，并且所述第一目标样本集不同于所述第二目标样本集。 15.一种用于训练对比学习模型的装置，包括：获取模块，被配置用于获取用于训练所述对比学习模型的多个样本集，所述多个样本集包括第一样本集和第二样本集；选择模块，被配置用于从所述第一样本集和所述第二样本集中选择第一目标样本集；确定模块，被配置用于按照预定义的批次大小，基于所述第一目标样本集确定第一组样本；以及训练模块，被配置用于利用所述第一组样本来训练所述对比学习模型。 16.一种电子设备，包括：至少一个处理单元；以及至少一个存储器，所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令，所述指令在由所述至少一个处理单元执行时使所述设备执行根据权利要求1至14中任一项所述的方法。 17.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现根据权利要求1至14中任一项所述的方法。 18.一种用于数据处理的方法，包括：使用根据权利要求1的所述方法来训练所述对比学习模型；以及权　利　要　求　书 2/3 页 3 CN 115511104 A 3

专利 用于训练对比学习模型的方法、装置、设备和介质

专利用于训练对比学习模型的方法、装置、设备和介质