全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111169186.X (22)申请日 2021.10.08 (66)本国优先权数据 202110502668.6 2021.0 5.09 CN (71)申请人 电子科技大 学 地址 611731 四川省成 都市高新区(西区) 西源大道 2006号 (72)发明人 周帆 余柳 代雨柔 钟婷  (74)专利代理 机构 成都虹盛汇泉专利代理有限 公司 51268 代理人 王伟 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/00(2012.01) G06N 20/00(2019.01) (54)发明名称 长尾级联流行度预测模 型、 训练方法及预测 方法 (57)摘要 本发明公开了一种长尾级联流行度预测模 型、 训练方法及预测方法, 该长尾级联流行度预 测模型包括骨干网络、 以及位于骨干网络之后的 回归器, 回归器包括并行设置的原始回归器和子 网络SUB; 骨干网络和原始回归器构成长尾级联 流行度预测模 型的基线模型; 骨干网络用于提取 长尾级联的时间特征和空间特征; 原始回归器用 于得到该长尾级联流行度的原始预测值; 述子网 络SUB用于得到该长尾级联流行度的加权偏差; 以该长尾级联流行度的原始预测值与加权偏差 之和作为最终流行度预测值。 本发 明利用解耦的 思想, 整个模型训练分为两个阶段, 首先利用不 同的采样策略来提取骨干网络的特征表示, 然后 将骨干网络的参数固定住, 再通过几种不同的方 法微调回归器, 该回归器结合了原始的预测值和 由子网络SUB产生的加权偏差值, 达到更准确预 测流行度的目的。 权利要求书2页 说明书12页 附图2页 CN 113887806 A 2022.01.04 CN 113887806 A 1.一种长尾级联流行度预测模型, 其特征在于包括骨干网络、 以及位于骨干网络之后 的回归器, 所述回归器包括并行设置的原始回归器和子网络SUB; 所述骨干网络和原始回归 器构成长尾级联流行度预测模型的基线模型; 所述骨干网络用于提取长尾级联的时间特 征和空间特 征; 所述原始回归器用于依据骨干网络提取的时间特征和空间特征, 得到该长尾级联流行 度的原始预测值; 所述子网络SUB用于依据骨干网络提取的时间特征和空间特征, 得到该长尾级联流行 度的加权偏差; 以该长尾级联流行度的原 始预测值与加权偏差之和作为 最终流行度预测值。 2.根据权利要求1所述长尾级联流行度预测模型, 其特征在于所述子网络SUB包括并行 设置的第一分支子网络和第二分支子网络; 第一分支子网络用于获取该条长尾级联在R个 类别中的偏差br; 第二分支子网络通过全连接层和softmax函数得到该条长尾级联在R个类 别的偏差的概 率pr, 则该条长尾级联流行度的加权偏差为 3.权利要求1或2所述长尾级联流行度预测模型的训练方法, 其特征在于包括以下步 骤: S1数据预处理: 统计每一条级联在观测时间内的转发路径, 将每一条级联的历史转发 过程用加权的有向无环图来表示, 并划分出输入数据和流行度标签, 得到训练集数据; 经过 预处理后的原始数据集为长尾分布, 将其按照标签的大小降序排序, 将训练集划分为R大 类。 S2提取骨干网络的参数: 基于步骤S1预处理后的R大类训练集, 分别 采用多种采样策略 学习长尾级联流行度预测模型的骨干网络表示, 从多种采样策略得到的结果中筛选出骨干 网络的最优表示; S3微调回归器: 基于步骤S1预处理后的R大类训练集, 分别 采用多种微调方法对骨干 网 络固定后的长尾级联流行度预测模型进行微调, 得到 长尾级联流行度预测模型。 4.根据权利要求3所述长尾级联流行度预测模型的训练方法, 其特征在于步骤S1中, 对 原始数据集按照以下分步骤进行 预处理: S11对原始数据集进行筛选; 本步骤中过滤掉原始数据集在观测时间内转发量|C(ts)| <10的级联, 对于|C(ts)|>100的级联, 只会选择 前100名的参与者; S12对筛选出的每一条级联的历史转发过程用加权有向无环图来表示, 得到训练集数 据, 并划分出输入数据和标签(即流行度); 例如输入数据为X={xi=Ci(ts)}, yi=Pi(tp), i ∈{1, 2, ..., n}, 其中xi表示级联观测时间内的转发, yi表示xi的标签(即流行度), tp为预测 时间, n表示训练集总数量; S13将训练集数据按照流行度划分为R大类; nj代表类别j训练样本的个数, R代表 类别的 个数, 所以训练集的总数量 5.根据权利要求4所述长尾级联流行度预测模型的训练方法, 其特征在于步骤S2中, 使 用的采样策略包括实例平衡采样、 类平衡采样、 平方根采样和渐进平衡采样。 6.根据权利要求5所述长尾级联流行度预测模型的训练方法, 其特征在于, 令pj为从类 别j采样的概 率, 考虑 则四种采样策略具体为:权 利 要 求 书 1/2 页 2 CN 113887806 A 2(1)实例平衡采样 策略(Instance ‑Balanced  Sampling), 这是最常见的采用策略之一, 训练集中的每 个样本具有相等的被选择概 率, 即q=1: nj表示当前类别的样本数量、 nr表示不同类别的样本数量; (2)类平衡采样 策略(Class ‑Balanced  Sampling), 不同类别的样本具有相等的被选择 概率, 即q=0: (3)平方根采样策略(Square ‑Root Sampling), 作为实例平衡采样和类平衡采样之间 的折衷策略, 令q=1/2: (4)渐进平衡采样 策略(Progressively ‑Balanced  Sampling), 该策略结合了前几种策 略的特征, 其中e 是当前迭代次数, E是控制迭代总数的超参数: 7.根据权利要求4所述长尾级联流行度预测模型的训练方法, 其特征在于步骤S3 中, 所 述微调方法包括回归器重新训练法和 η归一 化回归器训练法: (1)回归器重训练法: 首先将S2中得到的骨干网络参数θ保持固定, 然后随机初始化回 归器, 并使用类平衡采样策略对训练集进行采样, 进一步对整个长尾级联流行度预测模型 进行训练; (2)η归一化回归器训练法: 使S2中得到的骨干网络参数θ 以及按照回归器重训练方法 得到的回归器参数w和b保持固定, 并使用类平衡采样策略对训练集进行采样, 再使用 正则化回归器中的w, 进一步对整个长尾级联流行度预测模型进行训练, 学 习正则化的缩放因子 η。 8.一种长尾级联流行度 预测方法, 其特征在于将待预测级联输入到权利要求1至7任一 权利要求构建的长尾级联流行度预测模型中, 得到该待预测级联的流行度预测值。 9.根据权利要求8所述长尾级联流行度预测方法, 其特 征在于包括以下步骤: L1将待预测级联的历史转发过程用加权有向无环图来表示; L2将使用加权有向无环图表示的待预测级联输入到构建的长尾级联流行度预测模型 中, 得到该待预测级联的流行度预测值。权 利 要 求 书 2/2 页 3 CN 113887806 A 3

.PDF文档 专利 长尾级联流行度预测模型、训练方法及预测方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 长尾级联流行度预测模型、训练方法及预测方法 第 1 页 专利 长尾级联流行度预测模型、训练方法及预测方法 第 2 页 专利 长尾级联流行度预测模型、训练方法及预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:03:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。