全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211300354.9 (22)申请日 2022.10.24 (71)申请人 康键信息技 术 (深圳) 有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (入驻深圳市 前海商务秘书 有限公司) (72)发明人 魏苗 赵芳  (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 专利代理师 郭晓迪 (51)Int.Cl. G06F 8/71(2018.01) G06N 20/00(2019.01) (54)发明名称 一种基于机器学习的页面缓存方法、 装置、 设备及介质 (57)摘要 本发明涉及人工智能及数字医疗领域, 公开 了一种基于机器学习的页面缓存方法、 装置、 设 备及介质, 通过获取页面源代码对应历史版本的 变更信息, 以当前版本的源代码下一次变更的时 间间隔为预测目标, 页面源代码对应历史版本的 变更信息为训练数据, 通过极端梯度提升 XGBoost算法进行模型训练, 以获得预测模型, 根 据预测结果, 对页面的客户端缓存进行配置。 该 实施方式可实现Web页面资源文件缓存的智能 化、 精细化设置, 提升Web页面的缓存效率, 解决 Web页面更新不及时, 频繁重新请求加载资源导 致服务器流量过大、 处 理负载增 加的技术问题。 权利要求书2页 说明书11页 附图5页 CN 115454495 A 2022.12.09 CN 115454495 A 1.一种基于 机器学习的页面缓存方法, 其特 征在于, 包括: 获取页面源代码对应历史版本的变更信 息, 其中, 所述历史版本的变更信息包括: 历史 版本的源代码对应的文件类型、 历史版本的源代码的行数、 历史版本的源代码的新增变更 标识、 历史版本的源代码的变更版本数量、 历史版本的源代码每次变更相对于第一次上线 的时间间隔、 历史版本的源代码每次变更相对于下一次变更的时间 间隔; 以当前版本的源代码下一 次变更的时间间隔为预测目标, 页面源代码对应历史版本的 变更信息为训练数据, 通过极端梯度提升XGBo ost算法进行模型训练, 以获得 预测模型; 获取页面源代码对应当前版本的版本信 息, 并利用所述预测模型对当前版本的源代码 对应文件的下一次变更时间间隔进行预测, 其中, 所述版本信息包括: 当前版本的源代码对 应的文件类型、 当前版本的源代码的行数、 当前版本的源代码的新增变更标识、 当前版本的 源代码的变更 版本数量、 当前 版本的源代码变更相对于第一次上线的时间 间隔; 根据预测结果, 对页面的客户端缓存进行配置 。 2.根据权利要求1所述的方法, 其特征在于, 所述以当前版本的源代码下一 次变更的时 间间隔为预测目标, 页面源代码对应历史版本的变更信息为训练数据, 通过极端梯度提升 XGBoost算法进行模型训练, 以获得 预测模型的步骤, 包括: 将当前版本的源代码下一 次变更的时间间隔为因变量, 页面源代码对应历史版本的变 更信息为自变量进行回归训练, 并将数据划分为训练集和 测试集; 将页面源代码对应历史版本的变更信 息作为建模特征值, 根据 所述建模特征值进行建 模训练, 使用组合调参方式进行参数调整, 以得到 输出平方误差最小的模型作为预测模型。 3.根据权利要求2所述的方法, 其特征在于, 所述将当前版本的源代码下一 次变更的时 间间隔为因变量, 页面源代码对应历史版本的变更信息为自变量进行回归训练, 并将数据 划分为训练集和 测试集的步骤, 包括: 将当前版本的源代码下一 次变更的时间间隔为因变量, 页面源代码对应历史版本的变 更信息为自变量进行回归训练; 采用K折交叉验证方式, 对数据集进行划分处 理, 以划分出训练集和 测试集。 4.根据权利要求2所述的方法, 其特征在于, 所述将页面源代码对应历史版本的变更信 息作为建模特征值, 根据所述建模特征值进 行建模训练, 使用组合调参方式进 行参数调整, 以得到输出平方误差最小的模型作为预测模型的步骤, 包括: 对页面源代码对应历史版本的变更信息进行降维处 理; 根据降维处 理后的特 征值进行建模训练; 使用组合调参方式进行参数调整, 以得到 输出平方误差最小的模型作为预测模型。 5.根据权利要求1所述的方法, 其特征在于, 所述获取页面源代码对应历史版本的变更 信息的步骤, 包括: 通过运行脚本程序从Git版本库中获取页面源代码对应历史版本的变更信息 。 6.根据权利要求1所述的方法, 其特征在于, 所述根据预测结果, 对页面的客户端缓存 进行配置的步骤, 包括: 对预测的当前版本的源代码对应文件的下一 次变更时间间隔进行降序排列, 并从上至 下分为第一部分和第二部分; 获取页面源代码对应当前 版本的新增文件及变更文件;权 利 要 求 书 1/2 页 2 CN 115454495 A 2对所述第一部分对应的源代码的页面文件、 当前版本的新增文件及变更文件设置客户 端缓存模式为协商缓存, 对所述第二部 分对应的源代码的页面文件设置客户端缓存模式为 强缓存。 7.根据权利要求6所述的方法, 其特征在于, 所述对所述第 一部分对应的源代码的页面 文件、 当前版本的新增文件及变更文件设置客户端缓存模式为协商缓存, 对所述第二部分 对应的源代码的页面文件设置客户端缓存 模式为强缓存的步骤, 具体包括: 通过Web服务器配置, 对所述第一部分对应的源代码的页面文件、 当前版本的新增文件 及变更文件的请求响应头设置Last ‑Modified和ETa g属性; 通过Web服务器配置, 对所述第二部分对应的源代码的页面文件的请求响应头设置 Expires和Cac he‑Control属性, 过期时间设置为模型 预测的下一次变更时间 间隔。 8.一种基于 机器学习的页面缓存 装置, 其特 征在于, 包括: 数据获取模块, 用于获取页面源代码对应历史版本的变更信 息, 其中, 所述历史版本的 变更信息包括: 历史版本的源代码对应的文件类型、 历史版本的源代码的行数、 历史版本的 源代码的新增变更标识、 历史版本的源代码的变更版本数量、 历史版本的源代码每次变更 相对于第一次上线的时间间隔、 历史版本的源代码每次变更相对于下一次变更的时间间 隔; 模型训练模块, 用于以当前版本的源代码下一次变更的时间间隔为预测目标, 数据获 取模块采集的页面源代码对应历史版本的变更信息为训练数据, 通过极端梯度提升 XGBoost算法进行模型训练, 以获得 预测模型; 时间预测模块, 用于获取页面源代码对应当前版本的版本信息, 并利用所述模型训练 模块训练出的预测模型对当前版本的源代码对应文件的下一次变更时间间隔进行预测, 其 中, 所述版本信息包括: 当前版本的源代码对应的文件类型、 当前版本的源代码的行数、 当 前版本的源代码的新增变更标识、 当前版本的源代码的变更版本数量、 当前版本的源代码 变更相对于第一次上线的时间 间隔; 缓存配置模块, 用于根据所述时间预测模块的预测结果, 对页面的客户端缓存进行配 置。 9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 7中任一项所述基于 机器学习的页面缓存方法的步骤。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处理器执行时实现如权利要求 1至7中任一项 所述基于机器学习的页 面缓存方法的步骤。权 利 要 求 书 2/2 页 3 CN 115454495 A 3

.PDF文档 专利 一种基于机器学习的页面缓存方法、装置、设备及介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于机器学习的页面缓存方法、装置、设备及介质 第 1 页 专利 一种基于机器学习的页面缓存方法、装置、设备及介质 第 2 页 专利 一种基于机器学习的页面缓存方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:10:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。