全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111357775.0 (22)申请日 2021.11.16 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 (72)发明人 陈虹珠 曾桂平  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 代理人 单冠飞 (51)Int.Cl. G06N 20/00(2019.01) G06N 3/08(2006.01) (54)发明名称 一种机器学习算法模 型的训练方法、 装置及 存储介质 (57)摘要 本公开提出一种机器学习算法模型的训练 方法、 装置及存储介质, 方法包括: 设置模型训练 参数; 对所述模型训练参数进行数据处理; 对数 据处理后的模 型训练参数进行特征选择; 选择算 法模型, 并基于特征选择后的模 型训练参数对所 述选择的算法模型进行训练以得到训练后的算 法模型。 本公开提供的方法建模效率较高、 操作 简单、 可用性和实用性均较大、 人力成本较低、 可 解释性强。 权利要求书3页 说明书16页 附图8页 CN 114219096 A 2022.03.22 CN 114219096 A 1.一种机器学习算法模型的训练方法, 其特 征在于, 所述方法包括: 设置模型训练参数; 对所述模型训练参数进行 数据处理; 对数据处 理后的模型训练参数进行 特征选择; 选择算法模型, 并基于特征选择后的模型训练参数对选择的算法模型进行训练以得到 训练后的算法模型, 以及, 利用所述训练后的算法模型实现智能识别和/或智能预测。 2.根据权利要求1所述的机器学习算法模型的训练方法, 其特征在于, 所述设置模型训 练参数, 包括: 选择训练数据集文件, 所述训练数据集文件 包括模型训练参数; 确定所述训练数据集文件的相关信息, 所述相关信息包括唯一标识列名、 目标变量列 名; 选择业务问题, 所述业务问题包括分类问题、 回归问题、 逻辑回归问题; 其中, 不同业务 问题对应选择不同的算法模型; 确定特征选择方法, 所述特征选择方法包括: 过滤法、 包裹式特征选择方法、 Lasso、 嵌 入式特征选择方法; 确定是否对 模型训练参数进行不平衡处 理; 确定训练模型文件的保存路径, 所述训练模型文件包括所述训练后的算法模型的参数 信息。 3.根据权利要求2所述的机器学习算法模型的训练方法, 其特征在于, 所述数据处理, 包括: 删除重复值处 理; 异常值处 理; 缺失值处 理; 数据标准 化处理; 数据离散化处理; 类别型数据编码处 理; 其中, 若设置模型训练参数时, 确定对模型训练参数进行不平衡处理, 则所述数据处理 还包括不平衡处 理。 4.根据权利要求2所述的机器学习算法模型的训练方法, 其特征在于, 所述对数据处理 后的模型训练参数进行 特征选择, 包括: 基于设置模型训练参数时所确定的特征选择方法对所述数据处理后的模型训练参数 进行特征选择。 5.根据权利要求2所述的机器学习算法模型的训练方法, 其特征在于, 所述选择算法模 型, 包括: 基于设置模型训练参数时所选择的业 务问题选择对应的算法模型。 6.根据权利要求5所述的机器学习算法模型的训练方法, 其特征在于, 所述基于设置模 型训练参数时所选择的业 务问题选择对应的算法模型, 包括: 若所述业务问题为分类问题或逻辑回归问题, 确定选择的算法模型为: 逻辑回归算法 模型, 所述逻辑回归算法模型采用分类决策树 算法;权 利 要 求 书 1/3 页 2 CN 114219096 A 2若所述业务问题为回归问题, 确定选择的算法模型为: 线性回归算法模型, 所述线性 回 归算法模型采用回归决策树 算法。 7.根据权利要求2所述的机器学习算法模型的训练方法, 其特征在于, 所述方法还包 括: 将所述训练后的算法模型的参数信息保存至所述训练模型文件中。 8.根据权利要求2所述的机器学习算法模型的训练方法, 其特征在于, 所述方法还包 括: 选择预测数据集文件, 所述预测数据集文件 包括模型 预测数据; 确定所述预测数据集文件相关信息, 所述相关信息包括唯一标识列名、 目标变量列名; 确定阈值确定方法, 所述阈值确定方法包括: 基于KS的阈值确定法, 基于F ‑Score的阈 值确定法, 人工指定阈值法; 建立预测结果保存文件, 所述预测结果保存文件位于所述训练模型文件的保存路径 中, 所述预测结果保存文件用于保存 对于所述训练后的算法模型的预测结果; 基于所述预测数据集文件和所述阈值确定方法对所述训练后的算法模型进行预测以 输出模型报告, 并将所述模型报告保存至所述预测结果保存文件中, 所述模型报告包括对 于所述训练后的算法模型的预测结果。 9.一种机器学习算法模型的训练装置, 其特 征在于, 所述装置包括: 设置模块, 用于设置模型训练参数; 处理模块, 用于对所述模型训练参数进行 数据处理; 特征选择模块, 用于对数据处 理后的模型训练参数进行 特征选择; 训练模块, 用于选择算法模型, 并基于特征选择后的模型训练参数对所述选择的算法 模型进行训练以得到训练后的算法模型, 以及, 利用所述训练后的算法模型实现智能识别 和/或智能预测。 10.根据权利要求9所述的机器学习算法模型的训练装置, 其特征在于, 所述设置模块, 还用于: 选择训练数据集文件, 所述训练数据集文件 包括模型训练参数; 确定所述训练数据集文件的相关信息, 所述相关信息包括唯一标识列名、 目标变量列 名; 选择业务问题, 所述业务问题包括分类问题、 回归问题、 逻辑回归问题; 其中, 不同业务 问题对应选择不同的算法模型; 确定特征选择方法, 所述特征选择方法包括: 过滤法、 包裹式特征选择方法、 Lasso、 嵌 入式特征选择方法; 确定是否对 模型训练参数进行不平衡处 理; 确定训练模型文件的保存路径, 所述训练模型文件包括所述训练后的算法模型的参数 信息。 11.根据权利要求10所述的机器学习算法模型的训练装置, 其特征在于, 所述数据处 理, 包括: 删除重复值处 理; 异常值处 理;权 利 要 求 书 2/3 页 3 CN 114219096 A 3

.PDF文档 专利 一种机器学习算法模型的训练方法、装置及存储介质

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种机器学习算法模型的训练方法、装置及存储介质 第 1 页 专利 一种机器学习算法模型的训练方法、装置及存储介质 第 2 页 专利 一种机器学习算法模型的训练方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:00:28上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。