(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211044162.6
(22)申请日 2022.08.30
(71)申请人 电子科技大 学
地址 611731 四川省成 都市高新区 (西区)
西源大道 2006号
(72)发明人 王庆先 黄庆 常奥 曾昌强
吴苏强
(74)专利代理 机构 成都先导云创知识产权代理
事务所(普通 合伙) 51321
专利代理师 李坤
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/9035(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于时间感知的逆倾向得分的项目推
荐方法
(57)摘要
本发明涉及互联网领域, 具体涉及一种基于
时间感知的逆倾向得分的项目推荐方法, 本发明
通过对曝光倾向计算引入改进后的逆倾向得分
计算方法(TE ‑DeepFM), 且改进后的逆倾向计算
方法计算项目曝光倾向和用户项目曝光偏好的
匹配值, 使得本发明提出的方法充分考虑了数据
间曝光与点击之间的因果关系, 从而达到通过本
方法生成的项目推荐列表更符合用户期望, 增加
“曝光‑点击”的概率; 本发明解决了传统的推荐
方法得到的推荐列表与用户期望存在较大差距
的问题。
权利要求书3页 说明书7页 附图2页
CN 115329202 A
2022.11.11
CN 115329202 A
1.一种基于时间感知的逆倾向得分的项目推荐方法, 其特 征在于, 包括以下步骤:
步骤1: 采集带有时间戳的新闻推荐数据和短视频推荐数据, 并对带有时间戳的新闻推
荐数据和短视频 数据进行 预处理, 得到曝光 ‑点击数据;
步骤2: 对曝光 ‑点击数据进行 特征提取, 得到历史 交互特征;
步骤3: 提取历史 交互特征中的项目和时间戳, 并计算时间序列中的相对时间 间隔;
步骤4: 基于时间 间隔与所设置的阈值将历史 交互记录分为 正负样本;
步骤5: 对正负 样本进行同等 概率抽样处 理, 得到无偏测试集;
步骤6: 根据历史交互特征, 采用逆倾向评分计算方法计算用户的曝光偏好特征和项目
的曝光倾向特征;
步骤7: 结合用户的历史交互特征和曝光倾向特征利用基于深度学习的因子分解机进
行模型训练并计算得到得到项目i曝光后是否被用户u点击的点击概 率;
步骤8: 基于无偏测试集验证因子分解机的除偏效果;
步骤9: 根据训练完成的因子分解机生成点击率降序的项目推荐列表。
2.根据权利要求1所述的一种基于时间感知的逆倾向得分的项目推荐方法, 其特征在
于, 所述步骤3包括以下步骤:
步骤3.1: 提取历史交互特征中的项目和时间戳, 得到历史交互序列中具有时间间隔的
数据, 并基于时间序列对历史 交互特征进行排序, 得到历史 交互特征序列数据;
步骤3.2: 对历史交互特征序列数据, 按照历史交互特征发生的时间节点, 计算相邻两
个历史交互记录的相对时间间隔; 并根据用户分组计算该用户的所有点击项目的最早时间
和最近时间, 计算该用户交 互记录的时间总跨度:
所述相对时间 间隔的计算表达公式为:
其中, T*为相对时间间隔, Ti为用户当前交互项目的时间戳, Ti‑1为用户上一个交互项目
的时间戳, T为用户交 互记录的时间总跨度。
3.根据权利要求1所述的一种基于时间感知的逆倾向得分的项目推荐方法, 其特征在
于, 所述步骤4包括以下步骤:
步骤4.1: 将历史 交互特征中相对时间 间隔小于时间长度阈值的交 互记录作为负 样本;
步骤4.2: 将历史 交互特征中相对时间 间隔大于时间长度阈值的交 互记录作为 正样本。
4.根据权利要求1所述的一种基于时间感知的逆倾向得分的项目推荐方法, 其特征在
于, 所述步骤6包括以下步骤:
步骤6.1: 基于时间衰减函数计算项目点击量:
式中, Yu,i,t为计算了时间衰减的项目点击量,
为时间衰减函数, 按照指数衰减; B
为冷却系数, 为一个超参数, 用于控制时间衰减的强度; Yu,i为未计算时间衰减的项目点击
量;
步骤6.2: 对考虑了时间衰减的项目点击量进行求和, 并与数据中项目的最大曝光量相
除, 得到项目曝光 倾向和用户曝光偏好:权 利 要 求 书 1/3 页
2
CN 115329202 A
2式中: pi,t为项目i在t时刻的曝光倾向, Yu,i,t为计算了时间衰减的项目点击量, ∑为求
和符号,
为表示所有项目中的最大曝光量, τ为项目曝光 倾向的平 滑项; pu,t为
用户曝光偏好;
为带有时间衰减的项目点击量的累积和; |Iu|为表示用户交互的项
目数量;
步骤6.3: 基于项目曝光倾向和用户曝光偏好, 针对单个用户及其交互的项目进行再次
求和之后的平均值, 得到最终的用户曝光偏好的表示:
θu,i,t=α‑|pu,t‑pi,t|;
式中: θu,i,t表示改进后的倾向得分, α 为阀值用以限定曝光倾向的上限, pu,t为用户的曝
光偏好, pi,t为项目的曝光倾向, 倾向得分θu,i,t表示为用户的曝光偏好和项目 的曝光倾向的
匹配程度; 当用户的 曝光偏好和项目的 曝光程度越匹配, 则该项目有更 大概率被点击;
步骤6.4: 将倾向得分θu,i,t分别与训练集、 验证集和测试集中的历史交互特征进行拼
接:
h′=[u,i,t,Yu,i, θu,i,t];
式中: θu,i,t为改进后的倾向得分, 取值为[0,1]之间的值; 其中u为用户特征; i为项目特
征; t为时间戳; Yu,i为样本是否被 点击, 0表示未点击, 1表示点击; [u,i,t,Yu,i, θu,i,t]为将项
目曝光倾向得分和用户的历史交互特征的一 维向量相拼接, h ′为拼接后的用户项目历史交
互记录条。
5.根据权利要求1所述的一种基于时间感知的逆倾向得分的项目推荐方法, 其特征在
于, 所述步骤7包括以下步骤:
步骤7.1: 计算项目曝光倾向的特征向量与用户的曝光偏好特征之间的绝对值距离, 并
将阈值和差的绝对值做减法作为初始倾向得分;
步骤7.2: 基于初始倾向得分, 计算基于深度学习的因子分解机的预测评分误差;
步骤7.3: 基于曝光偏好特征和项目的曝光倾向特征计算基于深度学习的因子分解机
的预测评分;
步骤7.4: 根据预测评分误差和预测评分, 计算项目被曝光的评分。
6.根据权利要求5所述的一种基于时间感知的逆倾向得分的项目推荐方法, 其特征在
于, 所述预测评分误差的计算公式如下:
式中:
为正样本的曝光率;
为负样本的曝光率, D为全部项目总数, θu,i为基权 利 要 求 书 2/3 页
3
CN 115329202 A
3
专利 一种基于时间感知的逆倾向得分的项目推荐方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:33:12上传分享