全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211123871.3 (22)申请日 2022.09.15 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 李广凯 陈卉敏  (74)专利代理 机构 北京市通商律师事务所 11951 专利代理师 姜莹丽 许念如 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 30/02(2012.01) G06N 20/00(2019.01) (54)发明名称 渠道质量评估方法、 模型训练方法、 装置及 电子设备 (57)摘要 本公开提供了渠道质量评估方法、 模 型训练 方法、 装置及电子设备, 涉及数据处理领域, 尤其 涉及人工智 能技术领域。 具体实现方案为: 获取 预测数据集, 预测数据集包括待评估推广渠道对 应的预测数据, 预测数据包括渠道属性特征、 关 联设备的设备属性特征以及关联用户的行为特 征; 基于预测数据集, 确定待评估推广渠道的质 量评估结果。 本方案中, 能够根据推广渠道的渠 道属性特征、 关联设备的设备属性特征以及关联 用户的行为特征, 对推广渠道的质量进行有效评 估, 有助于 筛选出高质量的推广渠道。 权利要求书4页 说明书25页 附图3页 CN 115471071 A 2022.12.13 CN 115471071 A 1.一种渠道质量评估方法, 包括: 获取预测数据集, 所述预测数据集包括待评估推广渠道对应的预测数据, 所述预测数 据包括渠道属性特 征、 关联设备的设备属性特 征以及关联用户的行为特 征; 基于所述预测数据集, 确定所述待评估推广渠道的质量评估结果。 2.根据权利要求1所述的方法, 其中, 所述行为特 征包括以下至少一项: 所述关联用户在第 一应用内的第 一子行为特征, 所述第 一应用为通过对应的推广渠道 推广的应用; 所述关联用户在第 二应用内的第 二子行为特征, 所述第 二应用为与 所述第一应用相关 联的应用。 3.根据权利要求2所述的方法, 其中, 所述行为特征包括所述关联用户在第 二应用内的 第二子行为特 征, 所述方法还 包括: 基于所述关联用户在第 二应用中进行指定操作的操作 数据确定所述第 二子行为特征, 和/或, 基于所述关联用户参与第二应用中推出 的指定活动的行为数据确定所述第二子行 为特征。 4.根据权利要求1 ‑3中任一项所述的方法, 其中, 所述基于所述预测数据集, 确定所述 待评估推广渠道的质量评估结果, 包括: 将所述预测数据集输入至预训练的渠道质量评估模型, 得到所述渠道质量评估模型输 出的所述待评估推广渠道的质量评估结果。 5.根据权利要求 4所述的方法, 其中, 所述渠道质量评估 模型是通过如下 方式获得的: 获取训练数据集, 所述训练数据集包括样本推广渠道对应的训练数据, 所述训练数据 包括渠道属性特征、 关联设备的设备属性特征、 关联用户的行为特征以及样 本标签, 所述样 本推广渠道对应的样本标签包括 正样本标签以及负 样本标签; 基于所述训练数据集进行模型训练, 得到所述渠道质量评估 模型。 6.根据权利要求5所述的方法, 其中, 所述样本推广渠道是通过如下 方式确定的: 获取初始训练数据集, 所述初始训练数据集包括初始样本推广渠道对应的训练数据, 所述初始样本推广渠道包括对应负 样本标签的第一推广渠道以及无 标签的第二推广渠道; 基于所述初始训练数据集进行半监 督训练, 得到半监 督训练模型; 基于所述半监 督训练模型确定各 所述初始样本推广渠道对应的样本标签的置信度; 将置信度满足预设的置信度条件的所述初始样本推广渠道确定为所述样本推广渠道。 7.根据权利要求6所述的方法, 其中, 所述基于所述初始训练数据集进行半监督训练, 得到半监 督训练模型, 通过如下 方式: 构建第一半监督训练数据集, 所述第 一半监督训练数据集包括所述第 一推广渠道对应 的训练数据以及第三推广渠道对应的训练数据, 所述第三推广渠道为从所述第二推广渠道 中随机抽取的与所述第一推广渠道相同数量的推广渠道; 基于所述第一半监 督训练数据集进行模型训练, 得到半监 督训练模型; 重复执行所述构建第 一半监督训练数据集, 基于所述第 一半监督训练数据集进行模型 训练, 得到半监 督训练模型的步骤, 直至得到第一预设数量的半监 督训练模型; 所述基于所述半监督训练模型确定各所述初始样本推广渠道对应的样本标签的置信 度, 包括:权 利 要 求 书 1/4 页 2 CN 115471071 A 2基于各所述半监督训练模型分别确定各所述初始样本推广渠道对应的样本标签的第 一子置信度; 基于各所述第一子 置信度确定各 所述初始样本推广渠道对应的样本标签的置信度。 8.根据权利要求6所述的方法, 其中, 所述基于所述初始训练数据集进行半监督训练, 得到半监 督训练模型, 通过如下 方式: 构建第二半监督训练数据集, 所述第 二半监督训练数据集包括所述第四推广渠道对应 的训练数据以及第五推广渠道对应的训练数据, 所述第四推广渠道为从所述第一推广渠道 中除间谍推广渠道以外的推广渠道, 所述间谍推广渠道为从所述第一推广渠道中随机抽取 的指定数量的推广渠道, 所述第五推广渠道为从第六推广渠道中随机抽取的与所述第四推 广渠道相同数量的推广渠道, 所述第六推广渠道包括所述间谍推广渠道以及所述第二推广 渠道; 基于所述第二半监 督训练数据集进行模型训练, 得到半监 督训练模型; 重复执行所述构建第 二半监督训练数据集, 基于所述第 二半监督训练数据集进行模型 训练, 得到半监 督训练模型的步骤, 直至得到第二预设数量的所述半监 督训练模型; 所述基于所述半监督训练模型确定各所述初始样本推广渠道对应的样本标签的置信 度, 包括: 基于各所述半监督训练模型分别确定各所述初始样本推广渠道对应的样本标签的第 二子置信度; 基于各所述第二子 置信度确定各 所述初始样本推广渠道对应的样本标签的置信度。 9.根据权利要求6 ‑8中任一项所述的方法, 其中, 所述第 一推广渠道是基于以下任一种 方式确定的: 基于预设定的异常判断规则与候选样本推广渠道的相关指标, 从候选样本推广渠道中 确定所述第一推广渠道; 将候选样本推广渠道的对应的预测数据输入预训练 的异常渠道检测模型, 得到所述异 常渠道检测模型输出的异常渠道检测结果, 基于所述异常渠道检测结果从所述候选样本推 广渠道中确定所述第一推广渠道。 10.一种渠道质量评估 模型的训练方法, 包括: 获取训练数据集, 所述训练数据集包括样本推广渠道对应的训练数据, 所述训练数据 包括渠道属性特征、 关联设备的设备属性特征、 关联用户的行为特征以及样 本标签, 所述样 本标签包括 正样本标签以及负 样本标签; 基于所述训练数据集进行模型训练, 得到所述渠道质量评估 模型。 11.根据权利要求10所述的方法, 其中, 所述行为特 征包括以下至少一项: 所述关联用户在第 一应用内的第 一子行为特征, 所述第 一应用为通过对应的推广渠道 推广的应用; 所述关联用户在第 二应用内的第 二子行为特征, 所述第 二应用为与 所述第一应用相关 联的应用。 12.根据权利要求11所述的方法, 其中, 所述行为特征包括所述关联用户在第 二应用内 的第二子行为特 征, 所述方法还 包括: 基于所述关联用户在第 二应用中进行指定操作的操作 数据确定所述第 二子行为特征,权 利 要 求 书 2/4 页 3 CN 115471071 A 3

.PDF文档 专利 渠道质量评估方法、模型训练方法、装置及电子设备

文档预览
中文文档 33 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 渠道质量评估方法、模型训练方法、装置及电子设备 第 1 页 专利 渠道质量评估方法、模型训练方法、装置及电子设备 第 2 页 专利 渠道质量评估方法、模型训练方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:13:49上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。