全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210887401.8 (22)申请日 2022.07.26 (71)申请人 中国长江三峡集团有限公司 地址 100038 北京市海淀区玉渊潭南路1号 申请人 上海勘测设计 研究院有限公司   三峡高科信息技 术有限责任公司 (72)发明人 金和平 朱强 张贺 章啸程  刘苇 宋百川 刘晓青 辜斌  赵鲲 王建东 田武 周灿  潘建初 张晓萌 姜鹏 习兰云  (74)专利代理 机构 北京三聚阳光知识产权代理 有限公司 1 1250 专利代理师 李斯锐 (51)Int.Cl. G06F 16/9535(2019.01)G06F 16/9537(2019.01) (54)发明名称 一种新闻推荐算法的优化方法和装置 (57)摘要 本发明公开了一种新闻推荐算法的优化方 法和装置, 所述方法包括: 在新闻平台上获取一 预设时间段内发布的所有与安全事故相关的新 闻, 对所述所有新闻进行去重处理, 得到第一新 闻集合, 其中所述去重处理剔除了在两个或两个 以上平台发布的同一新闻; 对所述第一新闻集合 进行筛选得到第二新闻集合; 对 所述第二新闻集 合中的每个新闻进行打分, 得到与每个新闻对应 的分数值; 根据所述分数值训练出相关新闻的推 荐算法, 本方法基于IDC工程建设和运行过程中 使用的设备类型和数量, 运用推荐系统思想和技 术, 定期对指定设备到安全事故新闻报道和事故 新闻到制定设备进行双向推荐, 从而及时发现 IDC站点内设施的相关隐患, 便于事先做出安全 预案。 权利要求书2页 说明书7页 附图3页 CN 115146175 A 2022.10.04 CN 115146175 A 1.一种新闻推荐算法的优化方法, 其特 征在于, 所述方法包括: 在新闻平台上获取一预设时间段内发布的所有与安全事故相关的新闻, 所述所有新闻 来自一个或多个新闻发布 平台; 对所述所有新闻进行去重处理, 得到第一新闻集合, 其中所述去重处理剔除了在两个 或两个以上平台发布的同一 新闻; 对所述第一新闻集合进行筛选, 得到第二新闻集合, 所述第二新闻集合中的至少一个 新闻为感兴趣的新闻; 对所述第二 新闻集合中的每 个新闻进行打 分, 得到与每 个新闻对应的分数值; 根据所述分数值训练出相关新闻的推荐算法, 所述推荐算法用于为与 所述安全事故关 联的新闻推荐更多相关的新闻。 2.根据权利要求1所述的方法, 其特征在于, 对所述所有新闻进行去重处理, 得到第一 新闻集合, 包括: 对所述所有新闻中的每一个新闻进行特征提取, 并根据所述提取的每个新闻的特征, 确定所述第一 新闻集合。 3.根据权利要求1所述的方法, 其特征在于, 对所述第一新闻集合进行筛选, 得到第二 新闻集合, 包括: 对所述第一 新闻集合中的每 个新闻进行关键词提取; 筛选符合所述关键词的至少一个新闻, 生成所述第一 新闻集合。 4.根据权利要求1所述的方法, 其特征在于, 对所述第一新闻集合进行筛选, 得到第二 新闻集合, 包括: 配置预训练的语言模型; 利用所述预训练的语言模型对用户感兴趣的新闻进行召回, 生成所述第二 新闻集合。 5.根据权利要求4所述的方法, 其特征在于, 利用所述预训练的语言模型对用户感兴趣 的新闻进行召回, 生成所述第二 新闻集合, 包括: 利用所述预训练的语言模型获得符合需求的新闻特 征; 将所述符合需求的新闻特征与所述第一新闻集合中每个新闻的新闻特征进行相似度 对比, 确定所有相似度大于等于阈值的新闻; 将所有相似度大于等于阈值的新闻组合, 生成所述第二 新闻集合。 6.根据权利要求1所述的方法, 其特征在于, 对所述第一新闻集合进行筛选, 得到第二 新闻集合, 包括: 获取所述第一 新闻集合经过关键词提取后, 得到的第一 新闻子集, 以及, 获取所述第一 新闻集合经过感兴趣新闻的召回后, 得到的第二 新闻子集; 结合所述第一 新闻子集和所述第二 新闻子集, 得到所述第二 新闻集合。 7.根据权利要求1 ‑6任一项所述的方法, 其特征在于, 所述根据 所述分数值训练出相关 新闻的推荐算法, 包括: 在所有分数值中以评分最高为优化目标, 将推荐的新闻信 息和对应的分数值加入到数 据集中, 进行增量学习训练, 迭代优化模型, 得到所述推荐算法。 8.一种新闻推荐算法的优化装置, 其特 征在于, 所述装置包括: 获取单元, 用于在新闻平台上获取一预设时间段内发布的所有与安全事故相关的新权 利 要 求 书 1/2 页 2 CN 115146175 A 2闻, 所述所有新闻来自一个或多个新闻发布 平台; 去重单元, 用于对所述所有新闻进行去重处理, 得到第 一新闻集合, 其中所述去重处理 剔除了在两个或两个以上平台发布的同一 新闻; 筛选单元, 用于对所述第 一新闻集合进行筛选, 得到第 二新闻集合, 所述第 二新闻集合 中的至少一个新闻为感兴趣的新闻; 评分单元, 用于对所述第二新闻集合中的每个新闻进行打分, 得到与每个新闻对应的 分数值; 训练单元, 用于根据所述分数值训练出相关新闻的推荐算法, 所述推荐算法用于为与 所述安全事故关联的新闻推荐更多相关的新闻。 9.一种电子设备, 其特征在于, 包括处理器和存储器, 所述处理器与所述存储器耦合, 其中, 所述存储器, 用于存 储计算机程序指令; 当所述处理器读取所述存储器 中存储的计算机程序指令时, 执行如权利要求1至7中任 一项所述的新闻推荐算法的优化方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现如权利要求1至7中 中任一项所述的新闻推荐算法的优化方法。权 利 要 求 书 2/2 页 3 CN 115146175 A 3

.PDF文档 专利 一种新闻推荐算法的优化方法和装置

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种新闻推荐算法的优化方法和装置 第 1 页 专利 一种新闻推荐算法的优化方法和装置 第 2 页 专利 一种新闻推荐算法的优化方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:33:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。