专利一种基于时间感知的逆倾向得分的项目推荐方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211044162.6 (22)申请日 2022.08.30 (71)申请人电子科技大学地址 611731 四川省成都市高新区（西区）西源大道 2006号 (72)发明人王庆先　黄庆　常奥　曾昌强　吴苏强　 (74)专利代理机构成都先导云创知识产权代理事务所(普通合伙) 51321 专利代理师李坤 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/9035(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种基于时间感知的逆倾向得分的项目推荐方法 (57)摘要本发明涉及互联网领域，具体涉及一种基于时间感知的逆倾向得分的项目推荐方法，本发明通过对曝光倾向计算引入改进后的逆倾向得分计算方法(TE ‑DeepFM)，且改进后的逆倾向计算方法计算项目曝光倾向和用户项目曝光偏好的匹配值，使得本发明提出的方法充分考虑了数据间曝光与点击之间的因果关系，从而达到通过本方法生成的项目推荐列表更符合用户期望，增加 “曝光‑点击”的概率；本发明解决了传统的推荐方法得到的推荐列表与用户期望存在较大差距的问题。权利要求书3页说明书7页附图2页 CN 115329202 A 2022.11.11 CN 115329202 A 1.一种基于时间感知的逆倾向得分的项目推荐方法，其特征在于，包括以下步骤：步骤1：采集带有时间戳的新闻推荐数据和短视频推荐数据，并对带有时间戳的新闻推荐数据和短视频数据进行预处理，得到曝光 ‑点击数据；步骤2：对曝光 ‑点击数据进行特征提取，得到历史交互特征；步骤3：提取历史交互特征中的项目和时间戳，并计算时间序列中的相对时间间隔；步骤4：基于时间间隔与所设置的阈值将历史交互记录分为正负样本；步骤5：对正负样本进行同等概率抽样处理，得到无偏测试集；步骤6：根据历史交互特征，采用逆倾向评分计算方法计算用户的曝光偏好特征和项目的曝光倾向特征；步骤7：结合用户的历史交互特征和曝光倾向特征利用基于深度学习的因子分解机进行模型训练并计算得到得到项目i曝光后是否被用户u点击的点击概率；步骤8：基于无偏测试集验证因子分解机的除偏效果；步骤9：根据训练完成的因子分解机生成点击率降序的项目推荐列表。 2.根据权利要求1所述的一种基于时间感知的逆倾向得分的项目推荐方法，其特征在于，所述步骤3包括以下步骤：步骤3.1：提取历史交互特征中的项目和时间戳，得到历史交互序列中具有时间间隔的数据，并基于时间序列对历史交互特征进行排序，得到历史交互特征序列数据；步骤3.2：对历史交互特征序列数据，按照历史交互特征发生的时间节点，计算相邻两个历史交互记录的相对时间间隔；并根据用户分组计算该用户的所有点击项目的最早时间和最近时间，计算该用户交互记录的时间总跨度：所述相对时间间隔的计算表达公式为：其中， T*为相对时间间隔， Ti为用户当前交互项目的时间戳， Ti‑1为用户上一个交互项目的时间戳， T为用户交互记录的时间总跨度。 3.根据权利要求1所述的一种基于时间感知的逆倾向得分的项目推荐方法，其特征在于，所述步骤4包括以下步骤：步骤4.1：将历史交互特征中相对时间间隔小于时间长度阈值的交互记录作为负样本；步骤4.2：将历史交互特征中相对时间间隔大于时间长度阈值的交互记录作为正样本。 4.根据权利要求1所述的一种基于时间感知的逆倾向得分的项目推荐方法，其特征在于，所述步骤6包括以下步骤：步骤6.1：基于时间衰减函数计算项目点击量：式中， Yu,i,t为计算了时间衰减的项目点击量，为时间衰减函数，按照指数衰减； B 为冷却系数，为一个超参数，用于控制时间衰减的强度； Yu,i为未计算时间衰减的项目点击量；步骤6.2：对考虑了时间衰减的项目点击量进行求和，并与数据中项目的最大曝光量相除，得到项目曝光倾向和用户曝光偏好：权　利　要　求　书 1/3 页 2 CN 115329202 A 2式中： pi,t为项目i在t时刻的曝光倾向， Yu,i,t为计算了时间衰减的项目点击量， ∑为求和符号，为表示所有项目中的最大曝光量， τ为项目曝光倾向的平滑项； pu,t为用户曝光偏好；为带有时间衰减的项目点击量的累积和； |Iu|为表示用户交互的项目数量；步骤6.3：基于项目曝光倾向和用户曝光偏好，针对单个用户及其交互的项目进行再次求和之后的平均值，得到最终的用户曝光偏好的表示： θu,i,t＝α‑|pu,t‑pi,t|；式中： θu,i,t表示改进后的倾向得分， α 为阀值用以限定曝光倾向的上限， pu,t为用户的曝光偏好， pi,t为项目的曝光倾向，倾向得分θu,i,t表示为用户的曝光偏好和项目的曝光倾向的匹配程度；当用户的曝光偏好和项目的曝光程度越匹配，则该项目有更大概率被点击；步骤6.4：将倾向得分θu,i,t分别与训练集、验证集和测试集中的历史交互特征进行拼接： h′＝[u,i,t,Yu,i, θu,i,t]；式中： θu,i,t为改进后的倾向得分，取值为[0,1]之间的值；其中u为用户特征； i为项目特征； t为时间戳； Yu,i为样本是否被点击， 0表示未点击， 1表示点击； [u,i,t,Yu,i, θu,i,t]为将项目曝光倾向得分和用户的历史交互特征的一维向量相拼接， h ′为拼接后的用户项目历史交互记录条。 5.根据权利要求1所述的一种基于时间感知的逆倾向得分的项目推荐方法，其特征在于，所述步骤7包括以下步骤：步骤7.1：计算项目曝光倾向的特征向量与用户的曝光偏好特征之间的绝对值距离，并将阈值和差的绝对值做减法作为初始倾向得分；步骤7.2：基于初始倾向得分，计算基于深度学习的因子分解机的预测评分误差；步骤7.3：基于曝光偏好特征和项目的曝光倾向特征计算基于深度学习的因子分解机的预测评分；步骤7.4：根据预测评分误差和预测评分，计算项目被曝光的评分。 6.根据权利要求5所述的一种基于时间感知的逆倾向得分的项目推荐方法，其特征在于，所述预测评分误差的计算公式如下：式中：为正样本的曝光率；为负样本的曝光率， D为全部项目总数， θu,i为基权　利　要　求　书 2/3 页 3 CN 115329202 A 3

专利 一种基于时间感知的逆倾向得分的项目推荐方法

专利一种基于时间感知的逆倾向得分的项目推荐方法