全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210936398.4 (22)申请日 2022.08.05 (71)申请人 山东省计算中心(国家超 级计算济 南中心) 地址 250014 山东省济南市历下区科院路 19号山东省计算中心 申请人 山东省人工智能研究院   齐鲁工业大学 (72)发明人 王英龙 张洪彪 舒明雷 孔祥龙  单珂  (74)专利代理 机构 济南泉城专利商标事务所 37218 专利代理师 支文彬 (51)Int.Cl. G06F 16/9535(2019.01)G06F 16/958(2019.01) G06F 16/335(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) (54)发明名称 一种基于语义交互和局部激活的企业资讯 推荐方法 (57)摘要 一种基于语义交互和局部激活的企业资讯 推荐方法, 通过SIN企业资讯编码器可以在标题 和内容之间进行单词级语义交互, 缓解了独立编 码标题和内容时的语义偏差, 有效增强了企业资 讯表示。 通过LAU用户编码器更加符合用户的真 实的行为习惯, 可 以分区域处理用户点击历史, 以细粒度的方式有效捕获用户的各种潜在兴趣。 提出的LAU用户编码器可以利用候选企业 资讯激 活相关的关键性潜在兴趣, 并结合注 意力机制使 其保留到了最终交互阶段, 这有效增强了用户兴 趣表示; 上述三点的成功使 得我们的方法有效提 高了企业资 讯推荐的准确性。 权利要求书5页 说明书10页 附图1页 CN 115357785 A 2022.11.18 CN 115357785 A 1.一种基于语义交 互和局部激活的企业资 讯推荐方法, 其特 征在于, 包括如下步骤: a)获取用户按时间降序的历史点击资讯序列数据V=[v1,v2,...,vi,...,vF]和候选企 业资讯 其中vi为第i个历史点击的资讯, i∈{1,...F}, F 为历史点击的资 讯数量, 为第i个候选企业资 讯, i∈{1,. ..O}, O为候选企业资 讯数量; b)将用户的历史点击资讯序列数据V和候选企业资讯Vcd分别输入到SIN企业咨询编码 器中, 分别得到历史点击资讯嵌入表示序列R=[r1,r2,...,ri,...,rF]和候选企业资讯嵌 入表示 其中ri为第i个历史点击资讯嵌入表示, i∈ {1,...F}, ricd为第i个候选企业资 讯嵌入表示, i∈{1, …O}; c)将历史点击资讯嵌入表示序列R和候选 企业资讯嵌入表示Rcd输入到LAU用户编码器, 得到最终的用户嵌入表示u; d)通过公式 计算得到用户对第i个候选企业资讯的点击概率得分 选取 概率最大的5个候选快讯推荐给用户。 2.根据权利要求1所述的基于语义交互和局部激活 的企业资讯推荐方法, 其特征在于: 步骤a)中F 取值为50。 3.根据权利要求1所述的基于语义交互和局部激活 的企业资讯推荐方法, 其特征在于, 步骤b)包括如下步骤: b‑1)使用Snownlp分词工具将每一条历史点击资讯的标题和内容分别转换成分词序 列, 得到截取最大长度为N的历史点击资讯的标题分词序列 [xt,1,xt,2,...,xt,i,...,xt,N]和 截取最大长度为M的历史点击资讯的内容分词序列[xc,1,xc,2,...,xc,i,...,xc,M], 其中xt,i 为第i个历 史点击资讯的标题分词, i∈{1,...N}, xc,i为第i个历 史点击资讯的内容分词, i ∈{1,...M}, 使用预训练的300维Glove中文词将历史点击资讯的标题分词序列[xt,1, xt,2,...,xt,i,...,xt,N]映射为历史点击资讯的标题分词向量序列[et,1,et,2,...,et,i,..., et,N], 将历史点击资讯的内容分词序列[xc,1,xc,2,...,xc,i,...,xc,M]映射为历史点击资讯 的内容分词向量序列[ec,1,ec,2,...,ec,i,...,ec,M]; b‑2)使用Snownlp分词工具将每一条候选企业资讯的标题和内容分别转换成分词序 列, 得到截取最大长度为N的候选企业资讯的标题分词序列 和 截取最大长度为M的候选企业资讯 的内容分词序列 其中 为第i个候选企业资讯的标题分词, i∈{1, …N}, 为第i个候选企业资讯的内容分词, i∈ {1 ,…M}, 使用预训练的300维Glove中文词将候选企业资讯的标题分词序列 映射为候选企业资讯的标题分词向量序列 将候选企业 资讯的内容 分词序列 映射为候选企业 资讯的内容 分词向量序列 权 利 要 求 书 1/5 页 2 CN 115357785 A 2b‑3)将历史点击资讯的标题 分词向量序列[et,1,et,2,…,et,i,…,et,N]和历史点击资讯 的内容分词向量序列[ec,1,ec,2,...,ec,i,...,ec,M]分别输入到SE ‑NET模型中, 得到历史点 击资讯的缩放后标题词序列[e ′t,1,e′t,2,...,e′t,i,...,e′t,N]和历史点击资讯的缩放后内 容词序列[e ′c,1,e′c,2,...,e′c,i,...,e′c,M], 将候选企业资讯的标题分词向量序列 和候选企业资讯的内容分词向量序列 分 别 输 入 到 S E ‑N E T 模 型 中 ,得 到 候 选 企 业 资 讯 的 缩 放 后 标 题 词 序 列 和候选企业资 讯的缩放后内容词序 列 b‑4)将历史点击资讯的缩放后标题词序列[e ′t,1,e′t,2,...,e′t,i,...,e′t,N]与历史点 击资讯的缩放后内容词序列[e ′c,1,e′c,2,...,e′c,i,...,e′c,M]拼接后得到历史点击资讯的 分词向量序列[e ′1,e′2,...,e′i,...,e′N+M], e′i为第i个拼接后得到历史点击资讯的分词 向量, i∈{1,...,N+M}, 将候选企业资讯的缩放后标题词序列 和候选企业资讯的缩放后内容词序列 拼接后得到候选企业 资讯的分词向量序列 e′icd为第i个拼接后得到 候选企业资 讯的分词向量; b‑5)通过多头自注意力网络分别建模历史点击资讯的分词向量序列[e ′1,e′2,...,e ′i,...,e′N+M]和候选企业资讯的分词向量序列 的相互作用 关系, 得到语义交互增强后的历史点击资讯的分词向量序列 及语 义交互增强后的候选企业资讯的分词向量序列 其中 为第 i个语义交互增强后的历史点击 资讯的分词向量, i∈{1,...,N+M}, 为第i个语义交互增 强后的候选企业资 讯的分词向量, i∈{1,. ..,N+M}; b‑6)通过公式 计算得到第i个语义交互增强后的历史点 击资讯的分词的注意力融合权重βword,i, 式中aword,i为第i个语义交互增强后的历 史点击资 讯的分词的权重, Wword和bword均为词注意力网络中 的投影参数, qword为分词的查询向量, T为转置, 通过公式 计算 得到第i个语义交互增强后的候选企业资讯的分词的注意力融合权重 式中 为 第i个语义交互增强后的候选企业资讯的分词的权重, 和 均为词注意力网络中的投影参数, 为分词的查询向量;权 利 要 求 书 2/5 页 3 CN 115357785 A 3

PDF文档 专利 一种基于语义交互和局部激活的企业资讯推荐方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于语义交互和局部激活的企业资讯推荐方法 第 1 页 专利 一种基于语义交互和局部激活的企业资讯推荐方法 第 2 页 专利 一种基于语义交互和局部激活的企业资讯推荐方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。