专利投放系统中的模型训练方法、资源投放方法及装置

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202111529873.8 (22)申请日 2021.12.15 (65)同一申请的已公布的文献号申请公布号 CN 113935554 A (43)申请公布日 2022.01.14 (73)专利权人北京达佳互联信息技术有限公司地址 100085 北京市海淀区上地西路6号1 幢1层101D1-7 (72)发明人林伟　 (74)专利代理机构广州三环专利商标代理有限公司 44202 专利代理师贾允　方秀琴 (51)Int.Cl. G06Q 10/04(2012.01) G06K 9/62(2022.01) G06F 16/335(2019.01) G06F 16/33(2019.01)(56)对比文件 CN 113590849 A,2021.1 1.02 CN 113392359 A,2021.09.14 CN 112862516 A,2021.0 5.28 CN 10876 5035 A,2018.1 1.06 US 2008077574 A1,20 08.03.27 仇笠舟.面向点击率预测的集成学习关键算法研究. 《中国优秀硕士学位论文全文数据库（信息科技辑）》 .2020,(第8 期),全文. 徐秦成.广告推荐投放系统的设计与实现. 《中国优秀硕士学位论文全文数据库（信息科技辑）》 .2021,(第9期),全文. Tu Dan-Dan 等.Using Unified Probabilistic Matrix Factorizati on for Contextual Advertisement Recom mendation. 《Journal of Software》 .2013,第24卷(第3期), 全文. 审查员刘旭恒 (54)发明名称投放系统中的模型训练方法、资源投放方法及装置 (57)摘要本公开关于一种投放系统中的模型训练方法、资源投放方法及装置。该方法包括：获取多个样本数据以及对应的样本标签；将所述样本结构化特征和所述样本非结构化信息输入预设模型，对所述样本多媒体的投放参数进行预测处理，得到第一预测结果和样本非结构化特征；将所述样本结构化特征和所述样本非结构化特征输入第二预测网络，对所述样本多媒体的投放参数进行预测处理，得到第二预测结果；根据所述样本标签、第一预测结果和第二预测结果，对所述第二预测网络进行训练，得到预排序模型。根据本公开提供的技术方案，可以使预排序模型结构较简单、且预排序模型的预测精度和效率较高。权利要求书5页说明书16页附图7页 CN 113935554 B 2022.05.13 CN 113935554 B 1.一种投放系统中的模型训练方法，其特征在于，包括：获取多个样本数据以及对应的样本标签，所述样本数据包括样本结构化特征和样本非结构化信息；所述样本结构化特征是基于样本多媒体的多媒体属性信息和样本对象的对象属性信息得到的；所述非结构化信息表征所述样本多媒体的多种媒体信息以及所述样本对象的交互信息；所述样本标签为交互指标信息；将所述样本结构化特征和所述样本非结构化信息输入预设模型，对所述样本多媒体的投放参数进行预测处理，得到第一预测结果和样本非结构化特征；所述预设模型为教师网络；将所述样本结构化特征和所述样本非结构化特征输入第二预测网络，对所述样本多媒体的投放参数进行预测处理，得到第二预测结果；所述第二预测网络为学生网络；根据所述样本标签、所述第一预测结果和所述第二预测结果，对所述第二预测网络进行训练，得到预排序模型；其中，所述预设模型包括非结构特征提取网络和第一预测网络；所述将所述样本结构化特征和所述样本非结构化信息输入预设模型，对所述样本多媒体的投放参数进行预测处理，得到第一预测结果和样本非结构化特征，包括：将所述样本非结构化信息输入所述非结构特征提取网络，进行特征提取处理，得到所述样本非结构化特征；将所述样本结构化特征和所述样本非结构化特征输入所述第一预测网络，对所述样本多媒体的投放参数进行预测处理，得到所述第一预测结果。 2.根据权利要求1所述的训练方法，其特征在于，所述根据所述样本标签、第一预测结果和第二预测结果，对所述第二预测网络进行训练，得到预排序模型，包括：根据所述第一预测结果、所述第二预测结果和所述样本标签，确定目标损失信息；基于所述目标损失信息训练所述第二预测网络，得到所述预排序模型。 3.根据权利要求2所述的训练方法，其特征在于，在基于所述目标损失信息训练所述第二预测网络，得到所述预排序模型步骤之前，所述方法还包括：根据所述第一预测结果和所述样本标签，确定第一损失信息；基于所述第一损失信息，更新所述第一预测网络的参数和所述非结构特征提取网络的参数，得到更新的预设模型；相应的，基于所述目标损失信息训练所述第二预测网络，得到所述预排序模型，包括：基于所述目标损失信息，更新所述第二预测网络的参数，得到更新的第二预测网络；根据更新的预设模型以及更新的第二预测网络，重复所述将所述样本非结构化信息输入预设模型中的非结构特征提取网络，进行特征提取处理，得到样本非结构化特征步骤，至所述基于所述目标损失信息，更新所述第二预测网络的参数，得到更新的第二预测网络步骤；获取预设时间对应的第二预测网络，作为所述预排序模型。 4.根据权利要求3所述的训练方法，其特征在于，所述根据所述第一预测结果和所述样本标签，确定第一损失信息步骤之后，还包括：根据所述第一损失信息和所述目标损失信息，确定第二损失信息；相应的，所述基于所述第一损失信息，更新所述第一预测网络的参数和所述非结构特权　利　要　求　书 1/5 页 2 CN 113935554 B 2征提取网络的参数，得到更新的预设模型步骤包括：基于根据所述第一损失信息和所述目标损失信息确定的所述第二损失信息，更新所述第一预测网络的参数和所述非结构特征提取网络的参数，得到更新的预设模型。 5.根据权利要求1所述的训练方法，其特征在于，所述样本多媒体的多种媒体信息包括样本图像信息、样本文本信息和样本音频信息，所述非结构特征提取网络包括卷积神经网络、图神经网络和编解码网络；所述将所述样本非结构化信息输入所述非结构特征提取网络，进行特征提取处理，得到所述样本非结构化特征步骤包括：将所述样本图像信息输入所述卷积神经网络，进行特征提取处理，得到样本图像特征；将所述样本文本信息和所述样本音频信息输入所述编解码网络，进行特征提取处理，得到样本文本特征和样本音频特征；将所述样本对象的交互信息输入所述图神经网络，进行特征提取处理，得到样本交互特征；对所述样本图像特征、所述样本文本特征、所述样本音频特征和所述样本交互特征进行拼接处理，得到所述非结构化特征。 6.根据权利要求2所述的训练方法，其特征在于，根据所述第一预测结果、所述第二预测结果和所述样本标签，确定目标损失信息步骤包括：根据所述第二预测结果和所述样本标签，确定第三损失信息；根据所述第二预测结果和所述第一预测结果，确定第四损失信息；基于所述第三损失信息和所述第四损失信息，得到所述目标损失信息。 7.根据权利要求3或4所述的训练方法，其特征在于，所述方法还包括：获取所述预设时间对应的预设模型，作为目标预设模型。 8.一种资源投放方法，其特征在于，包括：获取与目标对象匹配的召回资源、以及所述召回资源对应的结构化特征和非结构化特征，所述结构化特征是基于所述召回资源的资源属性特征和所述目标对象的对象属性特征得到的；所述非结构化特征是基于目标非结构特征提取网络对非结构化信息进行离线提取得到的；将所述召回资源对应的结构化特征和非结构化特征输入到预排序模型和目标预设模型，筛选出待投放的资源集合；向所述目标对象投放所述待投放的资源集合；其中，所述预排序模型为基于所述权利要求1~6任一项所述的训练方法得到的，所述目标预设模型为预设投放参数预测模型或者为基于所述权利要求7得到的所述目标预设模型。 9.根据权利要求8所述的方法，其特征在于，所述将所述召回资源对应的结构化特征和非结构化特征输入到预排序模型和目标预设模型，筛选出待投放的资源集合，包括：将所述召回资源对应的结构化特征和非结构化特征输入所述预排序模型，进行投放参数预测处理，得到所述召回资源对应的第一投放参数信息；根据所述第一投放参数信息，从所述召回资源中筛选出初始资源集合；将所述初始资源集合中各资源对应的结构化特征和非结构化信息输入所述目标预设模型，进行投放参数预测处理，得到第二投放参数信息；权　利　要　求　书 2/5 页 3 CN 113935554 B 3

专利 投放系统中的模型训练方法、资源投放方法及装置

专利投放系统中的模型训练方法、资源投放方法及装置