全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111364980.X (22)申请日 2021.11.17 (71)申请人 航天信息股份有限公司 地址 100195 北京市海淀区杏石口路甲18 号 (72)发明人 吴旭 曹晶晶  (74)专利代理 机构 北京思创大成知识产权代理 有限公司 1 1614 代理人 张立君 (51)Int.Cl. G06F 11/36(2006.01) G06N 20/00(2019.01) (54)发明名称 一种基于机器学习的代码质 量提升方法及 系统 (57)摘要 本发明提供一种基于机器学习的代码质量 提升方法及系统, 包括以下步骤: 通过代码质量 管理平台获取样本数据; 根据样 本数据画出散点 图, 取散点图的部分数据作为训练数据输入至待 训练模型, 直至待训练模型满足预设收敛条件, 得到目标模 型; 使用目标模型对开发人员后续提 交代码中对应单位行数出现的潜在问题数和收 敛时间进行预测, 得到预测结果; 将预测结果与 代码质量管理平台的实际检查结果通过可视化 的方式进行量化比较并图形化展示给开发人员。 本发明的技术方案的有益效果在于, 通过将预测 结果与实际检查结果进行量化比较并展示给开 发人员, 使得开发人员根据该量化比较结果提高 代码质量, 以解决代码质量 提升不上去的问题。 权利要求书2页 说明书8页 附图3页 CN 114116469 A 2022.03.01 CN 114116469 A 1.一种基于 机器学习的代码质量 提升方法, 其特 征在于, 包括以下步骤: 步骤S1, 通过代码质量管理平台获取样本数据, 所述样本数据包括根据所述代码质量 管理平台获取的检查项, 以及开 发人员当前提交代码中匹配每个所述检查项 出现的问题次 数; 步骤S2, 根据所述样本数据画出散点图, 取所述散点图的部分数据作为训练数据输入 至待训练模型, 直至所述待训练模型满足预设收敛 条件, 得到目标模型; 步骤S3, 使用所述目标模型对所述开发人员后续提交代码中对应所述单位行数出现的 潜在问题数和收敛时间进行 预测, 得到预测结果; 步骤S4, 将所述预测结果与代码质量管理平台的实际检查结果通过可视化的方式进行 量化比较并图形化展示给 所述开发人员。 2.根据所述权利要求1所述的代码质量提升方法, 其特征在于, 所述步骤S1包括以下步 骤: 步骤S11, 将每个所述检查项对应的检查结果生成检查向量, 所述检查向量的每个元素 表示一个所述检查项; 步骤S12, 按照时间顺序记录每次所述开发人员提交的代码对应的检查结果并生成检 查结果列表; 步骤S13, 将所述检查向量与所述检查结果列表中的数据逐一匹配, 生成匹配向量, 所 述匹配向量的每 个元素表示在此次检查中出现匹配于每 个所述检查项的问题次数。 3.根据所述权利要求1所述的代码质量提升方法, 其特征在于, 所述步骤S2包括以下步 骤: 步骤S21, 定义若干行数为单位行数, 根据所述样本数据中包含的所述问题次数计算出 所述当前提交代码中对应于所述单位行 数出现的问题次数; 步骤S22, 将所述问题次数与每个所述检查项对应于所述单位行数出现的问题次数分 别作为横纵坐标轴, 画出散点图; 步骤S23, 取所述散点图的部分数据作为训练数据输入至待训练模型, 直至所述待训练 模型满足预设收敛 条件, 得到目标模型。 4.根据所述权利要求1所述的代码质量提升方法, 其特征在于, 所述步骤S2中, 还包括: 使用除所述训练数据以外的其他所述散点图的数据输入至所述待训练模型, 对所述待训练 模型进行交叉验证。 5.根据所述权利要求1所述的代码质量提升方法, 其特征在于, 所述预设收敛条件包 括: 通过调整参数对预测值与实际值的均方误差进行调整, 所述调整参数包括预设阈值。 6.一种基于机器学习的代码质量提升系统, 实现如权利要求1 ‑5任意一项所述的基于 机器学习的代码质量 提升方法, 其特 征在于, 包括: 获取模块, 所述获取模块用于通过代码质量管理平台获取样本数据, 所述样本数据包 括根据所述代码质量管理平台获取的检查项, 以及获取开发人员当前提交代码中匹配每个 所述检查项出现的问题次数; 训练模块, 所述训练模块连接所述获取模块, 用于根据所述样本数据画出散点图, 取所 述散点图的部 分数据作为训练数据输入至待训练模型, 直至所述待训练模 型满足预设收敛 条件, 得到目标模型;权 利 要 求 书 1/2 页 2 CN 114116469 A 2预测模块, 所述预测模块连接所述训练模块, 用于使用所述目标模型对后续提交代码 中对应所述单位行 数出现的潜在问题数和收敛时间进行 预测, 得到预测结果; 展示模块, 所述展示模块连接所述预测模块, 用于将预测结果与实 际检查结果通过可 视化的方式进行量 化比较并图形化展示给 所述开发人员。 7.根据所述权利要求6所述的代码质量 提升系统, 其特 征在于, 所述获取模块包括: 第一生成单元, 所述第 一生成单元用于将每个所述检查项对应的检查结果生成检查向 量, 所述检查向量的每 个元素表示一个所述检查项; 第二生成单元, 所述第 二生成单元用于按照时间顺序记录每次所述开发人员提交 的代 码对应的检查结果并生成检查结果列表; 匹配单元, 所述匹配单元分别连接所述第一生成单元和所述第二生成单元, 用于将所 述检查向量与所述检查结果列表中的数据逐一匹配, 生成匹配 向量, 所述匹配向量的每个 元素表示在此次检查中出现匹配于每 个所述检查项的问题次数。 8.根据所述权利要求6所述的代码质量 提升系统, 其特 征在于, 所述训练模块包括: 计算单元, 所述计算单元用于计算所述当前提交代码中对应于单位行数出现的问题次 数; 其中, 定义若干行 数为所述单位行 数; 画图单元, 所述画图单元连接所述计算单元, 用于将所述问题次数与对应于所述单位 行数出现的所述问题次数分别作为横纵坐标轴, 画出散点图; 训练单元, 所述训练单元连接所述画图单元, 用于取所述散点图的部分数据作为训练 数据输入至待训练模型, 直至所述待训练模型满足预设收敛 条件, 得到目标模型。 9.根据所述权利要求8所述的代码质量 提升系统, 其特 征在于, 所述训练模块还 包括: 验证单元, 所述验证单元分别连接所述画图单元和训练单元, 用于使用除所述训练数 据以外的其他所述散点图的数据输入至所述待训练模型, 对所述待训练模型进行交叉验 证。 10.根据所述权利要求6所述的代码质量提升系统, 其特征在于, 所述预设收敛条件包 括: 通过调整参数对预测值与实际值的均方误差进行调整, 所述调整参数包括预设阈值。权 利 要 求 书 2/2 页 3 CN 114116469 A 3

.PDF文档 专利 一种基于机器学习的代码质量提升方法及系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于机器学习的代码质量提升方法及系统 第 1 页 专利 一种基于机器学习的代码质量提升方法及系统 第 2 页 专利 一种基于机器学习的代码质量提升方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 18:59:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。