全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211236314.2 (22)申请日 2022.10.10 (71)申请人 之江实验室 地址 311121 浙江省杭州市余杭区之江实 验室南湖总部 申请人 上海大学 (72)发明人 孙升 朱勇 张统一  (74)专利代理 机构 北京志霖恒远知识产权代理 有限公司 1 1435 专利代理师 戴莉 (51)Int.Cl. G06F 17/18(2006.01) G06F 17/11(2006.01) G06N 20/00(2019.01) (54)发明名称 一种基于机器学习的公 式模型构建方法、 系 统及装置 (57)摘要 本发明公开了一种基于机器学习的公式模 型构建方法、 系统及装置, 包括以下步骤: 步骤 S1: 构建隐式方程; 步骤S2: 得到组合空间; 步骤 S3: 通过所述专家知识进行约束, 获取方程的组 合空间; 步骤S4: 当方程组合数量超过预设阈值, 则利用演化计算或LASSO回归的机器学习方法进 行回归系数求解; 反之, 则使用矩阵的伪逆方法 进行系数求解; 步骤S5: 通过预设的评价公式, 求 解所述候选方程的评价系数, 根据所述评价系数 评价所述候选方程, 排序靠前的所述候选方程即 为最终结果。 本发明用于搜寻数据之间的关系, 并找出相应的表达式, 广泛适用于通过实验等手 段得到的具有一定特征的数据, 在材料构效关系 发现和力学中本构方程的发现有着良好的应用。 权利要求书2页 说明书9页 附图3页 CN 115292672 A 2022.11.04 CN 115292672 A 1.一种基于 机器学习的公式模型构建方法, 其特 征在于, 包括以下步骤: 步骤S1: 对用户给定的数据和待选基元函数集合, 基于专家知识构建隐式方程, 并对所 述隐式方程中的变量进行 无量纲化处 理, 得到无量纲变量; 步骤S2: 根据所述待选基元函数集合, 通过穷举组合构建各类项特征的特征空间进行 组合, 得到组合空间; 步骤S3: 所述特征空间中各特征项及由各特征项组成的方程通过所述专家知识进行约 束, 获取方程的组合空间; 步骤S4: 当所述组合空间中的方程组合数量超过预设阈值, 则利用演化计算或LASS O回 归的机器学习方法对所述组合空间中的方程进行回归系 数求解; 反之, 则使用矩阵的伪逆 方法对所述组合空间中的方程进行系数求 解; 最终, 得到多个候选方程; 步骤S5: 通过预设的评价公式, 求解所述候选方程的评价系数, 根据 所述评价系数评价 所述候选方程, 排序靠前的所述 候选方程即为 最终结果。 2.如权利要求1所述的一种基于机器学习的公式模型构建方法, 其特征在于, 所述步骤 S2具体包括以下子步骤: 步骤S21: 所述待选基元函数集合包括幂函数和基元函数, 对所述无量纲变量根据 所述 幂函数添加幂次, 并对添加过幂次的无量纲变量进行乘法组合, 得到含有幂次的无量纲变 量和各含幂次无量纲变量相乘的组合构成子特 征空间A; 步骤S22: 将子特 征空间A中的特 征根据所述基元函数进行运 算, 得到子特征空间B; 步骤S23: 将子特征空间A的特征和子特征空间B中的特征进行遍历乘法组合, 得到组合 特征空间C; 步骤S24: 将子特 征空间A、 子特 征空间B和组合特 征空间C进行组合, 得到组合空间。 3.如权利要求1所述的一种基于机器学习的公式模型构建方法, 其特征在于, 所述特征 空间中各特征项及由各特征项组成的方程通过所述专家知识进行约束, 所述专家知识通过 机器学习中的规则和现有公式进行设立, 规则如下: 无量纲变量指数的绝对值小于等于 5; 特征空间中的单个特 征项中无量纲变量的数量小于等于4; 特征空间中的单个特 征中所有无因次变量的指数的绝对和小于等于 6; 将任何同时包 含exp函数和l og函数的特 征丢弃; 当给定的数据中的特 征值由正负值组成, 则将l og函数和√函数丢弃; 当所述特 征空间中特 征的值的绝对值大于40, exp函数不会被 应用; 方程的项数小于 6; exp函数和l og函数不同时出现在一个方程中; 同一个元 素函数不允许 出现在方程的所有 项中; 方程中的元 素类型小于等于4; 当方程不满足上述 规则, 则将方程丢弃。 4.如权利要求1所述的一种基于机器学习的公式模型构建方法, 其特征在于, 所述步骤 S5具体包括以下子步骤: 步骤S51: 对于每个所述候选方程, 将每个变量循环处理为因变量, 将其他变量的数据 代入方程求解, 计算所述因变量的值与用户给定数据中相应的值之间的误差, 当所述误差权 利 要 求 书 1/2 页 2 CN 115292672 A 2大于预设临界值, 则所述候选方程对用户给定数据中相应的值的检验是失败的, 所述因变 量属于离群值, 将所述 候选方程丢弃; 反 之, 得到多个最优方程; 步骤S52: 利用定义分数、 所述最优方程中的变量个数、 所述最优方程中的最大项数、 所 述最优方程中重新检验的总次数、 所述最优方程的个数和所述最优方程的复杂度构建评估 公式; 步骤S53: 利用所述评估公式对所述组合空间中的函数列表进行穷举搜索, 获得更新后 的分数; 步骤S54: 将定义分数与更新后的分数组合为总分数, 所述总分数排序靠前的所述候选 方程即为 最终结果。 5.如权利要求1所述的一种基于机器学习的公式模型构建方法, 其特征在于, 所述专家 知识包括以下一种或任意多种函数: 矩阵基本操作相关函数、 矩阵分解的相关函数、 同矩阵 相关的基本数学函数、 数据分析相关函数、 数值微积分相关函数、 随机数相关函数、 随机变 量的描述相关函数、 随机变量的累积概率相关函数、 随机变量的逆累积分布相关函数、 随机 变量的数字特 征相关函数、 参数估计相关函数、 假设检验相关函数、 统计与概 率相关函数。 6.如权利要求1所述的一种基于机器学习的公式模型构建方法, 其特征在于, 所述待选 基元函数集合包括幂函数和基元函数, 所述基元函数由用户初始设置, 所述基元函数为 log、 exp、 sqr t和/或si n, 默认为 None, 即不添加基元函数, 仅进行 幂函数组合。 7.一种基于 机器学习的公式模型构建系统, 其特 征在于, 包括: 隐式方程构建模块: 用于对用户给定的数据和待选基元函数集合, 基于专家知识构建 隐式方程, 对所述隐式方程中的变量进行 无量纲化处 理, 得到无量纲变量; 组合空间构建模块: 用于根据所述待选基元函数集合, 通过穷举组合构建各类项特征 的特征空间进行组合, 得到组合空间; 专家知识约束模块: 用于对所述特征空间中各特征项及由各特征项组成的方程通过所 述专家知识进行约束, 获取 方程的组合空间; 候选方程构建模块: 用于当所述组合空间中的方程组合数量超过预设阈值, 则利用演 化计算或LASSO回归的机器学习方法对 所述组合空间中的方程进 行回归系数求解; 反之, 则 使用矩阵的伪逆方法对所述组合空间中的方程进行系数求 解; 最终, 得到多个候选方程; 结果输出模块: 用于通过预设的评价公式, 求解所述候选方程的评价系数, 根据 所述评 价系数评价所述 候选方程, 排序靠前的所述 候选方程即为 最终结果。 8.一种基于机器学习的公式模型构建装置, 其特征在于, 包括存储器和一个或多个处 理器, 所述存储器中存储有 可执行代码, 所述一个或多个处理器执行所述可执行代码时, 用 于实现权利要求1 ‑6中任一项所述的一种基于 机器学习的公式模型构建方法。 9.一种计算机可读存储介质, 其特征在于, 其上存储有程序, 该程序被处理器执行时, 实现权利要求1 ‑6中任一项所述的一种基于 机器学习的公式模型构建方法。权 利 要 求 书 2/2 页 3 CN 115292672 A 3

.PDF文档 专利 一种基于机器学习的公式模型构建方法、系统及装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于机器学习的公式模型构建方法、系统及装置 第 1 页 专利 一种基于机器学习的公式模型构建方法、系统及装置 第 2 页 专利 一种基于机器学习的公式模型构建方法、系统及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:10:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。