专利一种基于机器学习的页面缓存方法、装置、设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211300354.9 (22)申请日 2022.10.24 (71)申请人康键信息技术（深圳）有限公司地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室（入驻深圳市前海商务秘书有限公司） (72)发明人魏苗　赵芳　 (74)专利代理机构北京中强智尚知识产权代理有限公司 1 1448 专利代理师郭晓迪 (51)Int.Cl. G06F 8/71(2018.01) G06N 20/00(2019.01) (54)发明名称一种基于机器学习的页面缓存方法、装置、设备及介质 (57)摘要本发明涉及人工智能及数字医疗领域，公开了一种基于机器学习的页面缓存方法、装置、设备及介质，通过获取页面源代码对应历史版本的变更信息，以当前版本的源代码下一次变更的时间间隔为预测目标，页面源代码对应历史版本的变更信息为训练数据，通过极端梯度提升 XGBoost算法进行模型训练，以获得预测模型，根据预测结果，对页面的客户端缓存进行配置。该实施方式可实现Web页面资源文件缓存的智能化、精细化设置，提升Web页面的缓存效率，解决 Web页面更新不及时，频繁重新请求加载资源导致服务器流量过大、处理负载增加的技术问题。权利要求书2页说明书11页附图5页 CN 115454495 A 2022.12.09 CN 115454495 A 1.一种基于机器学习的页面缓存方法，其特征在于，包括：获取页面源代码对应历史版本的变更信息，其中，所述历史版本的变更信息包括：历史版本的源代码对应的文件类型、历史版本的源代码的行数、历史版本的源代码的新增变更标识、历史版本的源代码的变更版本数量、历史版本的源代码每次变更相对于第一次上线的时间间隔、历史版本的源代码每次变更相对于下一次变更的时间间隔；以当前版本的源代码下一次变更的时间间隔为预测目标，页面源代码对应历史版本的变更信息为训练数据，通过极端梯度提升XGBo ost算法进行模型训练，以获得预测模型；获取页面源代码对应当前版本的版本信息，并利用所述预测模型对当前版本的源代码对应文件的下一次变更时间间隔进行预测，其中，所述版本信息包括：当前版本的源代码对应的文件类型、当前版本的源代码的行数、当前版本的源代码的新增变更标识、当前版本的源代码的变更版本数量、当前版本的源代码变更相对于第一次上线的时间间隔；根据预测结果，对页面的客户端缓存进行配置。 2.根据权利要求1所述的方法，其特征在于，所述以当前版本的源代码下一次变更的时间间隔为预测目标，页面源代码对应历史版本的变更信息为训练数据，通过极端梯度提升 XGBoost算法进行模型训练，以获得预测模型的步骤，包括：将当前版本的源代码下一次变更的时间间隔为因变量，页面源代码对应历史版本的变更信息为自变量进行回归训练，并将数据划分为训练集和测试集；将页面源代码对应历史版本的变更信息作为建模特征值，根据所述建模特征值进行建模训练，使用组合调参方式进行参数调整，以得到输出平方误差最小的模型作为预测模型。 3.根据权利要求2所述的方法，其特征在于，所述将当前版本的源代码下一次变更的时间间隔为因变量，页面源代码对应历史版本的变更信息为自变量进行回归训练，并将数据划分为训练集和测试集的步骤，包括：将当前版本的源代码下一次变更的时间间隔为因变量，页面源代码对应历史版本的变更信息为自变量进行回归训练；采用K折交叉验证方式，对数据集进行划分处理，以划分出训练集和测试集。 4.根据权利要求2所述的方法，其特征在于，所述将页面源代码对应历史版本的变更信息作为建模特征值，根据所述建模特征值进行建模训练，使用组合调参方式进行参数调整，以得到输出平方误差最小的模型作为预测模型的步骤，包括：对页面源代码对应历史版本的变更信息进行降维处理；根据降维处理后的特征值进行建模训练；使用组合调参方式进行参数调整，以得到输出平方误差最小的模型作为预测模型。 5.根据权利要求1所述的方法，其特征在于，所述获取页面源代码对应历史版本的变更信息的步骤，包括：通过运行脚本程序从Git版本库中获取页面源代码对应历史版本的变更信息。 6.根据权利要求1所述的方法，其特征在于，所述根据预测结果，对页面的客户端缓存进行配置的步骤，包括：对预测的当前版本的源代码对应文件的下一次变更时间间隔进行降序排列，并从上至下分为第一部分和第二部分；获取页面源代码对应当前版本的新增文件及变更文件；权　利　要　求　书 1/2 页 2 CN 115454495 A 2对所述第一部分对应的源代码的页面文件、当前版本的新增文件及变更文件设置客户端缓存模式为协商缓存，对所述第二部分对应的源代码的页面文件设置客户端缓存模式为强缓存。 7.根据权利要求6所述的方法，其特征在于，所述对所述第一部分对应的源代码的页面文件、当前版本的新增文件及变更文件设置客户端缓存模式为协商缓存，对所述第二部分对应的源代码的页面文件设置客户端缓存模式为强缓存的步骤，具体包括：通过Web服务器配置，对所述第一部分对应的源代码的页面文件、当前版本的新增文件及变更文件的请求响应头设置Last ‑Modified和ETa g属性；通过Web服务器配置，对所述第二部分对应的源代码的页面文件的请求响应头设置 Expires和Cac he‑Control属性，过期时间设置为模型预测的下一次变更时间间隔。 8.一种基于机器学习的页面缓存装置，其特征在于，包括：数据获取模块，用于获取页面源代码对应历史版本的变更信息，其中，所述历史版本的变更信息包括：历史版本的源代码对应的文件类型、历史版本的源代码的行数、历史版本的源代码的新增变更标识、历史版本的源代码的变更版本数量、历史版本的源代码每次变更相对于第一次上线的时间间隔、历史版本的源代码每次变更相对于下一次变更的时间间隔；模型训练模块，用于以当前版本的源代码下一次变更的时间间隔为预测目标，数据获取模块采集的页面源代码对应历史版本的变更信息为训练数据，通过极端梯度提升 XGBoost算法进行模型训练，以获得预测模型；时间预测模块，用于获取页面源代码对应当前版本的版本信息，并利用所述模型训练模块训练出的预测模型对当前版本的源代码对应文件的下一次变更时间间隔进行预测，其中，所述版本信息包括：当前版本的源代码对应的文件类型、当前版本的源代码的行数、当前版本的源代码的新增变更标识、当前版本的源代码的变更版本数量、当前版本的源代码变更相对于第一次上线的时间间隔；缓存配置模块，用于根据所述时间预测模块的预测结果，对页面的客户端缓存进行配置。 9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求 1至 7中任一项所述基于机器学习的页面缓存方法的步骤。 10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求 1至7中任一项所述基于机器学习的页面缓存方法的步骤。权　利　要　求　书 2/2 页 3 CN 115454495 A 3

专利 一种基于机器学习的页面缓存方法、装置、设备及介质

专利一种基于机器学习的页面缓存方法、装置、设备及介质