(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210936398.4
(22)申请日 2022.08.05
(71)申请人 山东省计算中心(国家超 级计算济
南中心)
地址 250014 山东省济南市历下区科院路
19号山东省计算中心
申请人 山东省人工智能研究院
齐鲁工业大学
(72)发明人 王英龙 张洪彪 舒明雷 孔祥龙
单珂
(74)专利代理 机构 济南泉城专利商标事务所
37218
专利代理师 支文彬
(51)Int.Cl.
G06F 16/9535(2019.01)G06F 16/958(2019.01)
G06F 16/335(2019.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
(54)发明名称
一种基于语义交互和局部激活的企业资讯
推荐方法
(57)摘要
一种基于语义交互和局部激活的企业资讯
推荐方法, 通过SIN企业资讯编码器可以在标题
和内容之间进行单词级语义交互, 缓解了独立编
码标题和内容时的语义偏差, 有效增强了企业资
讯表示。 通过LAU用户编码器更加符合用户的真
实的行为习惯, 可 以分区域处理用户点击历史,
以细粒度的方式有效捕获用户的各种潜在兴趣。
提出的LAU用户编码器可以利用候选企业 资讯激
活相关的关键性潜在兴趣, 并结合注 意力机制使
其保留到了最终交互阶段, 这有效增强了用户兴
趣表示; 上述三点的成功使 得我们的方法有效提
高了企业资 讯推荐的准确性。
权利要求书5页 说明书10页 附图1页
CN 115357785 A
2022.11.18
CN 115357785 A
1.一种基于语义交 互和局部激活的企业资 讯推荐方法, 其特 征在于, 包括如下步骤:
a)获取用户按时间降序的历史点击资讯序列数据V=[v1,v2,...,vi,...,vF]和候选企
业资讯
其中vi为第i个历史点击的资讯, i∈{1,...F}, F
为历史点击的资 讯数量,
为第i个候选企业资 讯, i∈{1,. ..O}, O为候选企业资 讯数量;
b)将用户的历史点击资讯序列数据V和候选企业资讯Vcd分别输入到SIN企业咨询编码
器中, 分别得到历史点击资讯嵌入表示序列R=[r1,r2,...,ri,...,rF]和候选企业资讯嵌
入表示
其中ri为第i个历史点击资讯嵌入表示, i∈
{1,...F}, ricd为第i个候选企业资 讯嵌入表示, i∈{1, …O};
c)将历史点击资讯嵌入表示序列R和候选 企业资讯嵌入表示Rcd输入到LAU用户编码器,
得到最终的用户嵌入表示u;
d)通过公式
计算得到用户对第i个候选企业资讯的点击概率得分
选取
概率最大的5个候选快讯推荐给用户。
2.根据权利要求1所述的基于语义交互和局部激活 的企业资讯推荐方法, 其特征在于:
步骤a)中F 取值为50。
3.根据权利要求1所述的基于语义交互和局部激活 的企业资讯推荐方法, 其特征在于,
步骤b)包括如下步骤:
b‑1)使用Snownlp分词工具将每一条历史点击资讯的标题和内容分别转换成分词序
列, 得到截取最大长度为N的历史点击资讯的标题分词序列 [xt,1,xt,2,...,xt,i,...,xt,N]和
截取最大长度为M的历史点击资讯的内容分词序列[xc,1,xc,2,...,xc,i,...,xc,M], 其中xt,i
为第i个历 史点击资讯的标题分词, i∈{1,...N}, xc,i为第i个历 史点击资讯的内容分词, i
∈{1,...M}, 使用预训练的300维Glove中文词将历史点击资讯的标题分词序列[xt,1,
xt,2,...,xt,i,...,xt,N]映射为历史点击资讯的标题分词向量序列[et,1,et,2,...,et,i,...,
et,N], 将历史点击资讯的内容分词序列[xc,1,xc,2,...,xc,i,...,xc,M]映射为历史点击资讯
的内容分词向量序列[ec,1,ec,2,...,ec,i,...,ec,M];
b‑2)使用Snownlp分词工具将每一条候选企业资讯的标题和内容分别转换成分词序
列, 得到截取最大长度为N的候选企业资讯的标题分词序列
和
截取最大长度为M的候选企业资讯 的内容分词序列
其中
为第i个候选企业资讯的标题分词, i∈{1, …N},
为第i个候选企业资讯的内容分词, i∈
{1 ,…M}, 使用预训练的300维Glove中文词将候选企业资讯的标题分词序列
映射为候选企业资讯的标题分词向量序列
将候选企业 资讯的内容 分词序列
映射为候选企业 资讯的内容
分词向量序列
权 利 要 求 书 1/5 页
2
CN 115357785 A
2b‑3)将历史点击资讯的标题 分词向量序列[et,1,et,2,…,et,i,…,et,N]和历史点击资讯
的内容分词向量序列[ec,1,ec,2,...,ec,i,...,ec,M]分别输入到SE ‑NET模型中, 得到历史点
击资讯的缩放后标题词序列[e ′t,1,e′t,2,...,e′t,i,...,e′t,N]和历史点击资讯的缩放后内
容词序列[e ′c,1,e′c,2,...,e′c,i,...,e′c,M], 将候选企业资讯的标题分词向量序列
和候选企业资讯的内容分词向量序列
分 别 输 入 到 S E ‑N E T 模 型 中 ,得 到 候 选 企 业 资 讯 的 缩 放 后 标 题 词 序 列
和候选企业资 讯的缩放后内容词序 列
b‑4)将历史点击资讯的缩放后标题词序列[e ′t,1,e′t,2,...,e′t,i,...,e′t,N]与历史点
击资讯的缩放后内容词序列[e ′c,1,e′c,2,...,e′c,i,...,e′c,M]拼接后得到历史点击资讯的
分词向量序列[e ′1,e′2,...,e′i,...,e′N+M], e′i为第i个拼接后得到历史点击资讯的分词
向量, i∈{1,...,N+M}, 将候选企业资讯的缩放后标题词序列
和候选企业资讯的缩放后内容词序列
拼接后得到候选企业
资讯的分词向量序列
e′icd为第i个拼接后得到 候选企业资
讯的分词向量;
b‑5)通过多头自注意力网络分别建模历史点击资讯的分词向量序列[e ′1,e′2,...,e
′i,...,e′N+M]和候选企业资讯的分词向量序列
的相互作用
关系, 得到语义交互增强后的历史点击资讯的分词向量序列
及语
义交互增强后的候选企业资讯的分词向量序列
其中
为第
i个语义交互增强后的历史点击 资讯的分词向量, i∈{1,...,N+M},
为第i个语义交互增
强后的候选企业资 讯的分词向量, i∈{1,. ..,N+M};
b‑6)通过公式
计算得到第i个语义交互增强后的历史点
击资讯的分词的注意力融合权重βword,i, 式中aword,i为第i个语义交互增强后的历 史点击资
讯的分词的权重,
Wword和bword均为词注意力网络中
的投影参数, qword为分词的查询向量, T为转置, 通过公式
计算
得到第i个语义交互增强后的候选企业资讯的分词的注意力融合权重
式中
为
第i个语义交互增强后的候选企业资讯的分词的权重,
和
均为词注意力网络中的投影参数,
为分词的查询向量;权 利 要 求 书 2/5 页
3
CN 115357785 A
3
专利 一种基于语义交互和局部激活的企业资讯推荐方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:14:18上传分享