全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111534143.7 (22)申请日 2021.12.15 (71)申请人 三盟科技股份有限公司 地址 510000 广东省广州市越秀区太和岗 路10-16号2号楼3 02房 (72)发明人 钟晓迪 汪凡 陈国镇 徐凯  韩高强  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 曹万菊 (51)Int.Cl. G06F 30/27(2020.01) G06F 16/245(2019.01) G06F 16/28(2019.01) G06Q 10/04(2012.01)G06Q 50/20(2012.01) G06K 9/62(2022.01) G06F 111/06(2020.01) G06F 111/08(2020.01) (54)发明名称 基于大数据 的学生成绩预测方法、 系统、 计 算机及介质 (57)摘要 本发明公开了一种基于大数据的学生成绩 预测方法, 包括: 获取各年级学生的成绩数据; 对 所述成绩数据进行预处理; 将经过预处理的成绩 数据划分为训练集和测试集; 根据LightGBM和 Hyperopt算法构建初始学生成 绩预测模型; 根据 所述训练集和测试集分别对所述初始学生成绩 预测模型进行训练和测试, 进而获得最终学生成 绩预测模型; 根据所述最终学生成绩预测模型对 学生的成绩进行预测。 本发明还公开了一种基于 大数据的学生成绩预测系统、 计算机设备及可读 存储介质。 采用本发明, 能够融合多维数据并提 高数据的可利用价值, 且能够提高学生成绩的预 测精度。 权利要求书2页 说明书7页 附图2页 CN 114492156 A 2022.05.13 CN 114492156 A 1.一种基于大 数据的学生成绩预测方法, 其特 征在于, 包括: 获取各年级学生的成绩数据; 对所述成绩数据进行 预处理; 将经过预处理的成绩数据划分为训练集和 测试集; 根据LightGBM和Hyperopt算法构建初始学生成绩预测模型; 根据所述训练集和测试集分别对所述初始学生成绩预测模型进行训练和测试, 进而获 得最终学生成绩预测模型; 根据所述 最终学生成绩预测模型对学生的成绩进行 预测。 2.如权利要求1所述的基于大数据的学生成绩预测方法, 其特征在于, 所述获取各年级 学生的成绩数据的步骤 包括: 根据Spark引擎, 从Hive 数据库中获取 各年级学生的成绩数据。 3.如权利要求1所述的基于大数据的学生成绩预测方法, 其特征在于, 所述对所述成绩 数据进行 预处理的步骤 包括: 通过Spark引擎的弹性分布式数据及RDD对所述成绩数据进行预处理, 其中, 所述预处 理包括删除缺失值和异常值、 数据类型 的规范和转换, 多源异构数据集的融合以及自变量 和因变量的统一。 4.如权利要求1所述的基于大数据的学生成绩预测方法, 其特征在于, 所述根据 LightGBM和Hyperopt算法构建初始学生成绩预测模型的步骤 包括: 根据LightGBM算法构建原 始学生成绩预测模型; 根据Hyperopt算法采用模拟退火策略对所述原始学生成绩预测模型进行参数调优, 进 而获得初始学生成绩预测模型。 5.如权利要求4所述的基于大数据的学生成绩预测方法, 其特征在于, 所述模拟退火策 略如下: 初始化时, 初始温度T(充分大), 温度下限Tmin(充分小), 算法初始解x, 每个T值的迭代 次数L, 对l =1,2,…,L, 重复步骤1至步骤3, 步骤1, 产生 新解xnew=x+△x, 其中,△x为[dmin,dmax]之间的随机数, 步骤2, 计算 △f=f(xnew) ‑f(x), 其中f(x)为优化目标函数, 若 △f<0则接受xnew作为 新的当前解, 否则以概 率exp(‑△f/(kT))接受xnew作为 新的当前解, 步骤3, 当连续m个新解都没有被接受时或者满足结束条件时, 输出当前解作为最优解, 并退出所述模拟退火策略。 6.一种基于大数据的学生成绩预测系统, 其特征在于, 用于实现权利要求1~5任一所 述的基于大 数据的学生成绩预测方法, 包括: 数据获取模块, 用于获取 各年级学生的成绩数据; 数据预处 理模块, 用于对所述成绩数据进行 预处理; 数据化分模块, 用于将经 过预处理的成绩数据划分为训练集和 测试集; 模型构建模块, 用于根据L ightGBM和Hyperopt算法构建初始学生成绩预测模型; 模型训练模块, 用于根据所述训练集和测试集分别对所述初始学生成绩预测模型进行 训练和测试, 进而获得最终学生成绩预测模型; 成绩预测模块, 用于根据所述 最终学生成绩预测模型对学生的成绩进行 预测。权 利 要 求 书 1/2 页 2 CN 114492156 A 27.如权利要求6所述的基于大数据的学生成绩预测系统, 其特征在于, 所述数据获取模 块用于: 根据Spark引擎, 从Hive 数据库中获取 各年级学生的成绩数据; 所述数据预处理模块用于: 通过Spark引擎的弹性分布式数据及RDD对所述成绩数据进 行预处理, 其中, 所述预处理包括删除缺失值和异常值、 数据类型 的规范和转换, 多源异构 数据集的融合以及自变量和因变量的统一。 8.如权利要求6所述的基于大数据的学生成绩预测系统, 其特征在于, 所述模型构建模 块包括: 原始学生成绩预测模型构建单元, 用于根据LightGBM算法构建原始学生成绩预测模 型; 参数调优单元, 用于根据Hyperopt算法采用模拟退火策略对所述原始学生成绩预测模 型进行参数调优, 进 而获得初始学生成绩预测模型, 其中, 所述模拟退火策略如下: 初始化时, 初始温度T(充分大), 温度下限Tmin(充分小), 算法初始解x, 每个T值的迭代 次数L, 对l =1,2,…,L, 重复步骤1至步骤3, 步骤1, 产生 新解xnew=x+△x, 其中,△x为[dmin,dmax]之间的随机数, 步骤2, 计算 △f=f(xnew) ‑f(x), 其中f(x)为优化目标函数, 若 △f<0则接受xnew作为 新的当前解, 否则以概 率exp(‑△f/(kT))接受xnew作为 新的当前解, 步骤3, 当连续m个新解都没有被接受时或者满足结束条件时, 输出当前解作为最优解, 并退出所述模拟退火策略。 9.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至5中任一所述 方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至 5中任一所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114492156 A 3

.PDF文档 专利 基于大数据的学生成绩预测方法、系统、计算机及介质

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于大数据的学生成绩预测方法、系统、计算机及介质 第 1 页 专利 基于大数据的学生成绩预测方法、系统、计算机及介质 第 2 页 专利 基于大数据的学生成绩预测方法、系统、计算机及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:28:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。