全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210234415.X (22)申请日 2022.03.10 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 (72)发明人 汪达胜 沈丽忠 陈晗  (74)专利代理 机构 中原信达知识产权代理有限 责任公司 1 1219 专利代理师 张春晓 郝红玉 (51)Int.Cl. G06F 9/445(2018.01) (54)发明名称 模型数据处理方法、 装置、 电子设备和存储 介质 (57)摘要 本发明公开了模型数据处理方法、 装置、 电 子设备和存储介质, 涉及大数据分析技术领域。 该方法的一具体实施方式包括: 响应于模型构建 请求, 获取模型构建请求中模型类型, 以基于模 型类型查询对应的模型组件库; 获取模型描述信 息, 调用预设识别模型, 以识别模型描述信息中 数据来源 标识、 数据预处理算法标识和模型算法 标识, 进而分别从模型组件库中查询对应的数据 源组件、 数据预处理组件和模型训练组件; 调用 预设的模型组合模板, 将数据源组件、 数据预处 理组件和模型训练组件组合, 得出目标模型。 该 实施方式能够解决现有技术模型构建需要多次 生成组件, 导 致模型构建的效率较低的问题。 权利要求书3页 说明书11页 附图3页 CN 114625440 A 2022.06.14 CN 114625440 A 1.一种模型 数据处理方法, 其特 征在于, 包括: 响应于模型构建请求, 获取所述模型构建请求中模型类型, 以基于所述模型类型查询 对应的模 型组件库, 其中, 所述模型 组件库中包括数据源组件集合、 数据预 处理组件集合和 模型训练 组件集合; 获取模型描述信 息, 调用预设识别模型, 以识别所述模型描述信 息中数据来源标识、 数 据预处理算法标识和模型算法标识, 进而分别从所述模型组件库中查询对应的数据源组 件、 数据预处 理组件和模型训练 组件; 调用预设的模型组合模板, 将所述数据源组件、 所述数据预处理组件和所述模型训练 组件组合, 得 出目标模型。 2.根据权利要求1所述的方法, 其特 征在于, 所述预设识别模型包括关键词识别模型; 识别所述模型描述信息中数据来源标识、 数据预处 理算法标识和模型算法标识, 包括: 基于预设的数据来源词库识别所述模型描述信 息中数据来源标识, 基于所述数据 预处 理算法词 库识别所述模型描述信息中数据预处理算法标识; 基于所述模型算法词 库识别所 述模型描述信息中模型算法标识。 3.根据权利要求1所述的方法, 其特征在于, 调用预设的模型组合模板, 将所述数据源 组件、 所述数据处 理组件和所述模型训练 组件组合, 得 出目标模型, 包括: 查询所述数据源组件、 所述数据处理组件和所述模型训练组件分别对应的数据输入接 口和结果输出接口; 将所述数据输入接口和结果输出接口, 更新至模型组合模板; 基于更新后的模型组合模板、 所述数据源组件、 所述数据处理组件和所述模型训练组 件, 生成目标模型。 4.根据权利要求1所述的方法, 其特征在于, 所述分别从模型组件库中查询对应的数据 源组件、 数据预处 理组件和模型训练 组件, 包括: 查询所述模型类型对应的历史模型, 获取所述历史模型的数据源组件、 数据预处理组 件和模型训练 组件; 判断所述历史模型的数据源组件、 数据预处理组件和模型训练组件是否分别与所述数 据来源标识、 数据预处 理算法标识和模型算法标识匹配; 若是, 则将所述历史模型确定为所述目标模型; 若否, 则分别从模型组件库中查询对应 的数据源组件、 数据预处 理组件和模型训练 组件。 5.根据权利要求4所述的方法, 其特征在于, 分别从所述模型组件库中查询对应的数据 源组件、 数据预处 理组件和模型训练 组件, 包括: 获取所述历史模型的数据源组件与 所述数据来源标识的第 一匹配结果、 所述历史模型 的数据预处理组件与所述数据预处理算法标识的第二匹配结果和所述历史模型的模型训 练组件和模型算法标识的第三匹配结果; 判断所述第 一匹配结果、 所述第 二匹配结果和所述第 三匹配结果中匹配结果为匹配成 功的数量是否大于预设阈值; 若否, 则分别从模型组件库中查询对应的数据源组件、 数据预处理组件和模型训练组 件; 若是, 则基于不为匹配成功的匹配结果, 确定所述历史模型中待更新组件, 以从所述模 型组件库中查询目标组件, 替换所述待更新组件, 将替换后的历史模型确定为所述 目标模权 利 要 求 书 1/3 页 2 CN 114625440 A 2型。 6.根据权利要求1所述的方法, 其特征在于, 将所述数据源组件、 所述数据预处理组件 和所述模型训练 组件组合, 得 出目标模型之后, 还 包括: 接收模型训练请求, 获取 所述运行请求中数据源标识; 调用所述目标模型, 以基于所述数据源标识读取训练数据, 并得 出数据处理结果; 判断所述数据处 理结果是否满足预设训练条件; 若是, 则输出训练后的目标模型; 若否, 则调整所述目标模型中组件参数, 调用调整后 的目标模型, 以得出新的数据 处理结果, 直到所述新的数据 处理结果满足所述预设训练条 件。 7.根据权利要求1所述的方法, 其特征在于, 识别所述模型描述信息中数据来源标识、 数据预处 理算法标识和模型算法标识, 包括: 识别所述模型描述信 息中数据来源标识、 数据预处理算法标识集合和模型算法标识集 合, 其中, 所述数据预处理算法标识集合包括各数据预处理算法标识和所述各数据预处理 算法标识的第一组合顺序, 所述数据预处理算法标识集合包括各模型算法标识和所述模型 算法标识的第二组合 顺序; 调用预设的模型组合模板, 将所述数据源组件、 所述数据预处理组件和所述模型训练 组件组合, 得 出目标模型, 包括: 根据所述第一组合顺序, 组合各所述数据 预处理组件, 以及根据 所述第二组合顺序, 组 合所述模型训练 组件; 调用预设的模型组合模板, 将所述数据源组件、 组合的数据预处理组件和 组合的模型 训练组件组合, 得 出目标模型。 8.根据权利要求1所述的方法, 其特征在于, 将所述数据源组件、 所述数据预处理组件 和所述模型训练 组件组合, 得 出目标模型之后, 还 包括: 接收所述目标模型的查看请求, 生成所述目标模型的模型 结构图; 发送所述模型 结构图, 以对所述模型 结构图进行显示处 理。 9.一种模型 数据处理装置, 其特 征在于, 包括: 响应单元, 用于响应于模型构建请求, 获取所述模型构建请求中模型类型, 以基于所述 模型类型查询对应的模型组件库, 其中, 所述模型组件库中包括数据源组件集合、 数据预 处 理组件集合和模型训练 组件集合; 查询单元, 用于获取模型描述信息, 调用预设识别模型, 以识别所述模型描述信 息中数 据来源标识、 数据预处理算法标识和模型算法标识, 进而分别从所述模型组件库中查询对 应的数据源组件、 数据预处 理组件和模型训练 组件; 组合单元, 用于调用预设的模型组合模板, 将所述数据源组件、 所述数据 预处理组件和 所述模型训练 组件组合, 得 出目标模型。 10.根据权利要求9所述的装置, 其特 征在于, 所述预设识别模型包括关键词识别模型; 所述查询单元, 具体用于: 基于预设的数据来源标识词库识别所述模型描述信 息中数据来源标识, 基于所述数据 预处理算法词 库识别所述模型描述信息中数据预处理算法标识; 基于所述模型算法词 库识 别所述模型描述信息中模型算法标识。权 利 要 求 书 2/3 页 3 CN 114625440 A 3

.PDF文档 专利 模型数据处理方法、装置、电子设备和存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型数据处理方法、装置、电子设备和存储介质 第 1 页 专利 模型数据处理方法、装置、电子设备和存储介质 第 2 页 专利 模型数据处理方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:06:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。