(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202111529873.8
(22)申请日 2021.12.15
(65)同一申请的已公布的文献号
申请公布号 CN 113935554 A
(43)申请公布日 2022.01.14
(73)专利权人 北京达佳互联信息技 术有限公司
地址 100085 北京市海淀区上地西路6号1
幢1层101D1-7
(72)发明人 林伟
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
专利代理师 贾允 方秀琴
(51)Int.Cl.
G06Q 10/04(2012.01)
G06K 9/62(2022.01)
G06F 16/335(2019.01)
G06F 16/33(2019.01)(56)对比文件
CN 113590849 A,2021.1 1.02
CN 113392359 A,2021.09.14
CN 112862516 A,2021.0 5.28
CN 10876 5035 A,2018.1 1.06
US 2008077574 A1,20 08.03.27
仇笠舟.面向点击率预测的集成学习关键算
法研究. 《中国优秀硕士学位 论文全文数据库 (信
息科技辑) 》 .2020,(第8 期),全文.
徐秦成.广告推荐投放系统的设计与实现.
《中国优秀硕士学位 论文全文数据库 (信息科技
辑) 》 .2021,(第9期),全 文.
Tu Dan-Dan 等.Using Unified
Probabilistic Matrix Factorizati on for
Contextual Advertisement Recom mendation.
《Journal of Software》 .2013,第24卷(第3期),
全文.
审查员 刘旭恒
(54)发明名称
投放系统中的模 型训练方法、 资源投放方法
及装置
(57)摘要
本公开关于一种投放系统中的模型训练方
法、 资源投放方法及装置。 该方法包括: 获取多个
样本数据以及对应的样本标签; 将所述样本结构
化特征和所述样本非结构化信息输入 预设模型,
对所述样 本多媒体的投放参数进行预测处理, 得
到第一预测结果和样本非结构化特征; 将所述样
本结构化特征和所述样本非结构化特征输入第
二预测网络, 对 所述样本多媒体的投放参数进行
预测处理, 得到第二预测结果; 根据所述样本标
签、 第一预测结果和第二预测结果, 对所述第二
预测网络进行训练, 得到预排序模型。 根据本公
开提供的技术方案, 可以使预排序模 型结构较简
单、 且预排序模型的预测精度和效率较高。
权利要求书5页 说明书16页 附图7页
CN 113935554 B
2022.05.13
CN 113935554 B
1.一种投放系统中的模型训练方法, 其特 征在于, 包括:
获取多个样本数据以及对应的样本标签, 所述样本数据包括样本结构化特征和样本非
结构化信息; 所述样本结构化特征是基于样本多媒体的多媒体属性信息和样本对象的对象
属性信息得到的; 所述非结构化信息表征所述样本多媒体的多种媒体信息以及所述样本对
象的交互信息; 所述样本标签为交 互指标信息;
将所述样本结构化特征和所述样本非结构化信 息输入预设模型, 对所述样本多媒体的
投放参数进行预测处理, 得到第一预测结果和样本非结构化特征; 所述预设模型为教师网
络;
将所述样本结构化特征和所述样本非结构化特征输入第 二预测网络, 对所述样本多媒
体的投放 参数进行 预测处理, 得到第二预测结果; 所述第二预测网络为学生网络;
根据所述样本标签、 所述第一预测结果和所述第二预测结果, 对所述第二预测网络进
行训练, 得到预排序模型;
其中, 所述预设模型包括非结构特征提取网络和第一预测网络; 所述将所述样本结构
化特征和所述样本非结构化信息输入预设模型, 对所述样本多媒体的投放参数进 行预测处
理, 得到第一预测结果和样本非结构化特 征, 包括:
将所述样本非结构化信息输入所述非结构特征提取网络, 进行特征提取处理, 得到所
述样本非结构化特 征;
将所述样本结构化特征和所述样本非结构化特征输入所述第 一预测网络, 对所述样本
多媒体的投放 参数进行 预测处理, 得到所述第一预测结果。
2.根据权利要求1所述的训练方法, 其特征在于, 所述根据所述样本标签、 第一预测结
果和第二预测结果, 对所述第二预测网络进行训练, 得到预排序模型, 包括:
根据所述第一预测结果、 所述第二预测结果和所述样本标签, 确定目标损失信息;
基于所述目标损失信息训练所述第二预测网络, 得到所述预排序模型。
3.根据权利要求2所述的训练方法, 其特征在于, 在基于所述目标损失信 息训练所述第
二预测网络, 得到所述预排序模型步骤之前, 所述方法还 包括:
根据所述第一预测结果和所述样本标签, 确定第一损失信息;
基于所述第 一损失信 息, 更新所述第 一预测网络的参数和所述非结构特征提取网络的
参数, 得到更新的预设模型;
相应的, 基于所述目标损失信息训练所述第二预测网络, 得到所述预排序模型, 包括:
基于所述目标损失信息, 更新所述第二预测网络的参数, 得到更新的第二预测网络;
根据更新的预设模型以及更新的第 二预测网络, 重复所述将所述样本非结构化信 息输
入预设模 型中的非结构特征提取网络, 进 行特征提取处理, 得到样本非结构化特征步骤, 至
所述基于所述 目标损失信息, 更新所述第二预测网络的参数, 得到更新的第二预测网络步
骤;
获取预设时间对应的第二预测网络, 作为所述预排序模型。
4.根据权利要求3所述的训练方法, 其特征在于, 所述根据 所述第一预测结果和所述样
本标签, 确定第一损失信息步骤之后, 还 包括:
根据所述第一损失信息和所述目标损失信息, 确定第二损失信息;
相应的, 所述基于所述第一损 失信息, 更新所述第一预测网络的参数和所述非结构特权 利 要 求 书 1/5 页
2
CN 113935554 B
2征提取网络的参数, 得到更新的预设模型步骤 包括:
基于根据 所述第一损失信 息和所述目标损失信 息确定的所述第 二损失信 息, 更新所述
第一预测网络的参数和所述非结构特 征提取网络的参数, 得到更新的预设模型。
5.根据权利要求1所述的训练方法, 其特征在于, 所述样本多媒体的多种媒体信 息包括
样本图像信息、 样本文本信息和样本音频信息, 所述非结构特征提取网络包括卷积神经网
络、 图神经网络和编解码网络; 所述将所述样本非结构化信息输入所述非结构特征提取网
络, 进行特征提取处 理, 得到所述样本非结构化特 征步骤包括:
将所述样本图像信息 输入所述卷积神经网络, 进行 特征提取处 理, 得到样本图像特 征;
将所述样本文本信息和所述样本音频信息输入所述编解码网络, 进行特征提取处理,
得到样本文本特 征和样本音频 特征;
将所述样本对象的交互信息输入所述图神经网络, 进行特征提取处理, 得到样本交互
特征;
对所述样本 图像特征、 所述样本文本特征、 所述样本音频特征和所述样本交互特征进
行拼接处 理, 得到所述非结构化特 征。
6.根据权利要求2所述的训练方法, 其特征在于, 根据所述第一预测结果、 所述第二预
测结果和所述样本标签, 确定目标损失信息步骤 包括:
根据所述第二预测结果和所述样本标签, 确定第三损失信息;
根据所述第二预测结果和所述第一预测结果, 确定第四损失信息;
基于所述第三损失信息和所述第四损失信息, 得到所述目标损失信息 。
7.根据权利要求3或4所述的训练方法, 其特 征在于, 所述方法还 包括:
获取所述预设时间对应的预设模型, 作为目标 预设模型。
8.一种资源投放方法, 其特 征在于, 包括:
获取与目标对象匹配的召回资源、 以及所述召回资源对应的结构化特征和非结构化特
征, 所述结构化特征是基于所述召回资源的资源属性特征和所述目标对象的对象属性特征
得到的; 所述非结构化特征是基于目标非结构特征提取网络对非结构化信息进行离线提取
得到的;
将所述召回资源对应的结构化特征和非结构化特征输入到预排序模型和目标预设模
型, 筛选出待投放的资源集 合;
向所述目标对象投放所述待投放的资源集 合;
其中, 所述预排序模型为基于所述权利要求1~6任一项所述的训练方法得到的, 所述目
标预设模型为预设投放参数预测模型或者为基于所述权利要求7得到的所述目标预设模
型。
9.根据权利要求8所述的方法, 其特征在于, 所述将所述召回资源对应的结构化特征和
非结构化特 征输入到预排序模型和目标 预设模型, 筛 选出待投放的资源集 合, 包括:
将所述召回资源对应的结构化特征和非结构化特征输入所述预排序模型, 进行投放参
数预测处理, 得到所述召回资源 对应的第一投放 参数信息;
根据所述第一投放 参数信息, 从所述召回资源中筛 选出初始资源集 合;
将所述初始资源集合中各资源对应的结构化特征和非结构化信息输入所述目标预设
模型, 进行投放 参数预测处理, 得到第二投放 参数信息;权 利 要 求 书 2/5 页
3
CN 113935554 B
3
专利 投放系统中的模型训练方法、资源投放方法及装置
文档预览
中文文档
29 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 23:44:08上传分享