全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211396002.8 (22)申请日 2022.11.08 (71)申请人 北京有竹居网络技 术有限公司 地址 101299 北京市平谷区林荫北街13号 信息大厦802室 (72)发明人 吴昊 杨成  (74)专利代理 机构 北京世辉律师事务所 16 093 专利代理师 李峥宇 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 生成对比学习模型的负样本对的方法、 装 置、 设备和介质 (57)摘要 提供了生成对比学习模型的负样本对的方 法、 装置、 设备和介质。 在一种方法中, 从用于训 练对比学习模型的多个数据序列中的第一数据 序列中获取第一数据段, 并且从多个数据序列中 的第二数据序列中获取第二数据段。 从多个数据 序列中的第二数据序列以外的其他数据序列中 选择数据帧。 基于第二数据段和数据 帧, 生成第 三数据段。 基于第一数据段和第三数据段, 确定 用于训练对比学习模型的负样 本对。 利用本公开 的示例性实现方式, 可以在外观方面向负样本对 中引入更为丰富语义信息, 进而提高对比学习模 型的准确性。 权利要求书2页 说明书15页 附图6页 CN 115545117 A 2022.12.30 CN 115545117 A 1.一种用于生成对比学习模型的负 样本对的方法, 包括: 从用于训练所述对比学习模型的多个数据序列中的第 一数据序列中获取第 一数据段, 并且从所述多个数据 序列中的第二数据 序列中获取第二数据段; 从所述多个数据 序列中的所述第二数据 序列以外的其 他数据序列中选择 数据帧; 基于所述第二数据段和所述数据帧, 生成第三数据段; 以及 基于所述第一数据段和所述第三数据段, 确定用于训练所述对比学习模型的负样本 对。 2.根据权利要求1的所述方法, 其中生成所述第三数据段包括: 基于所述数据帧来 生成噪声数据帧; 以及 利用所述噪声数据帧来更新所述第二数据段中的数据帧。 3.根据权利要求2的所述方法, 其中生成所述噪声数据帧包括: 根据预定比例来调整所述数据帧的维度, 以生成中间数据帧; 复制所述中间数据帧以生成多个复制的中间数据帧; 以及 拼接所述多个复制的中间数据帧以生成所述噪声数据。 4.根据权利要求3的所述方法, 其中所述数据帧的所述维度包括宽度和高度中的至少 任一项。 5.根据权利要求3的所述方法, 进一步包括: 响应于确定所述噪声数据帧的分辨率与 所 述第二数据段中的所述数据帧的分辨 率不同, 执行以下至少任一项: 将所述噪声数据帧裁切至所述第二数据段中的所述数据帧的所述分辨 率; 将所述噪声数据帧缩放至所述第二数据段中的所述数据帧的所述分辨 率。 6.根据权利要求2的所述方法, 其中利用所述噪声数据帧来更新所述第二数据段中的 所述数据帧包括: 针对所述第二数据段中的所述数据帧中的给定数据点, 获取所述给定数据点的数据值; 获取所述噪声数据帧中的与所述给定数据点相对应的数据点的对应数据值; 以及 基于所述数据值、 所述对应数据值和所述噪声数据帧的权重, 确定所述数据帧中的与 所述给定数据点相对应的数据点的数据值。 7.根据权利要求1的所述方法, 其中获取所述第 一数据段包括: 从所述第 一数据序列中 选择满足预定 长度的所述第一数据段, 所述第一数据段仅包括单一镜 头。 8.根据权利要求7的所述方法, 其中获取所述第 二数据段包括: 从所述第 二数据序列中 选择满足所述预定 长度的所述第二数据段, 所述第二数据段仅包括单一镜 头。 9.根据权利要求1的所述方法, 进一 步包括: 确定所述第二数据 序列中的多个数据帧的数据范围; 确定所述 其他数据序列中的给定数据 序列中的多个数据帧的给定数据范围; 以及 响应于确定所述数据 范围与所述给定数据 范围之间的差异满足预定条件, 从所述给定 数据序列中选择 所述数据帧。 10.根据权利要求1的所述方法, 其中生成所述第三数据段进一步包括: 调整所述第三 数据段中的多个数据帧的采样频率。 11.根据权利要求1的所述方法, 进一 步包括: 调整所述第一数据 序列中的多个数据帧的采样频率, 以生成第四数据段;权 利 要 求 书 1/2 页 2 CN 115545117 A 2基于所述第一数据段和所述第四数据段, 确定用于训练所述对比学习模型的负样本 对。 12.根据权利要求1 1的所述方法, 进一 步包括: 基于所述第四数据段和所述数据帧, 生成第五数据段; 以及 基于所述第一数据段和所述第五数据段, 确定用于训练所述对比学习模型的负样本 对。 13.根据权利要求1的所述方法, 进一 步包括: 从所述第一数据 序列中获取第六 数据段; 基于所述第六 数据段和所述数据帧, 生成第七数据段; 以及 基于所述第一数据段和所述第七数据段, 确定用于训练所述对比学习模型的正样本 对。 14.根据权利要求13的所述方法, 进一步包括: 利用所述正样本对和所述负样本对, 训 练所述对比学习模型。 15.一种用于生成对比学习模型的负 样本对的装置, 包括: 获取模块, 被配置用于从用于训练所述对比学习 模型的多个数据序列中的第 一数据序 列中获取第一数据段, 并且从所述多个数据 序列中的第二数据 序列中获取第二数据段; 选择模块, 被配置用于从所述多个数据序列中的所述第 二数据序列以外的其他数据序 列中选择 数据帧; 生成模块, 被 配置用于基于所述第二数据段和所述数据帧, 生成第三数据段; 以及 确定模块, 被配置用于基于所述第 一数据段和所述第 三数据段以确定用于训练所述对 比学习模型的负 样本对。 16.一种电子设备, 包括: 至少一个处 理单元; 以及 至少一个存储器, 所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于 由所述至少一个处理单元执行的指 令, 所述指 令在由所述至少一个处理单元执行时使 所述 设备执行根据权利要求1至14中任一项所述的方法。 17.一种计算机可读存储介质, 其上存储有计算机程序, 所述计算机程序被处理器执行 时实现根据权利要求1至14中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115545117 A 3

.PDF文档 专利 生成对比学习模型的负样本对的方法、装置、设备和介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 生成对比学习模型的负样本对的方法、装置、设备和介质 第 1 页 专利 生成对比学习模型的负样本对的方法、装置、设备和介质 第 2 页 专利 生成对比学习模型的负样本对的方法、装置、设备和介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:44:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。