专利一种基于机器学习的公式模型构建方法、系统及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211236314.2 (22)申请日 2022.10.10 (71)申请人之江实验室地址 311121 浙江省杭州市余杭区之江实验室南湖总部申请人上海大学 (72)发明人孙升　朱勇　张统一　 (74)专利代理机构北京志霖恒远知识产权代理有限公司 1 1435 专利代理师戴莉 (51)Int.Cl. G06F 17/18(2006.01) G06F 17/11(2006.01) G06N 20/00(2019.01) (54)发明名称一种基于机器学习的公式模型构建方法、系统及装置 (57)摘要本发明公开了一种基于机器学习的公式模型构建方法、系统及装置，包括以下步骤：步骤 S1：构建隐式方程；步骤S2：得到组合空间；步骤 S3：通过所述专家知识进行约束，获取方程的组合空间；步骤S4：当方程组合数量超过预设阈值，则利用演化计算或LASSO回归的机器学习方法进行回归系数求解；反之，则使用矩阵的伪逆方法进行系数求解；步骤S5：通过预设的评价公式，求解所述候选方程的评价系数，根据所述评价系数评价所述候选方程，排序靠前的所述候选方程即为最终结果。本发明用于搜寻数据之间的关系，并找出相应的表达式，广泛适用于通过实验等手段得到的具有一定特征的数据，在材料构效关系发现和力学中本构方程的发现有着良好的应用。权利要求书2页说明书9页附图3页 CN 115292672 A 2022.11.04 CN 115292672 A 1.一种基于机器学习的公式模型构建方法，其特征在于，包括以下步骤：步骤S1：对用户给定的数据和待选基元函数集合，基于专家知识构建隐式方程，并对所述隐式方程中的变量进行无量纲化处理，得到无量纲变量；步骤S2：根据所述待选基元函数集合，通过穷举组合构建各类项特征的特征空间进行组合，得到组合空间；步骤S3：所述特征空间中各特征项及由各特征项组成的方程通过所述专家知识进行约束，获取方程的组合空间；步骤S4：当所述组合空间中的方程组合数量超过预设阈值，则利用演化计算或LASS O回归的机器学习方法对所述组合空间中的方程进行回归系数求解；反之，则使用矩阵的伪逆方法对所述组合空间中的方程进行系数求解；最终，得到多个候选方程；步骤S5：通过预设的评价公式，求解所述候选方程的评价系数，根据所述评价系数评价所述候选方程，排序靠前的所述候选方程即为最终结果。 2.如权利要求1所述的一种基于机器学习的公式模型构建方法，其特征在于，所述步骤 S2具体包括以下子步骤：步骤S21：所述待选基元函数集合包括幂函数和基元函数，对所述无量纲变量根据所述幂函数添加幂次，并对添加过幂次的无量纲变量进行乘法组合，得到含有幂次的无量纲变量和各含幂次无量纲变量相乘的组合构成子特征空间A；步骤S22：将子特征空间A中的特征根据所述基元函数进行运算，得到子特征空间B；步骤S23：将子特征空间A的特征和子特征空间B中的特征进行遍历乘法组合，得到组合特征空间C；步骤S24：将子特征空间A、子特征空间B和组合特征空间C进行组合，得到组合空间。 3.如权利要求1所述的一种基于机器学习的公式模型构建方法，其特征在于，所述特征空间中各特征项及由各特征项组成的方程通过所述专家知识进行约束，所述专家知识通过机器学习中的规则和现有公式进行设立，规则如下：无量纲变量指数的绝对值小于等于 5；特征空间中的单个特征项中无量纲变量的数量小于等于4；特征空间中的单个特征中所有无因次变量的指数的绝对和小于等于 6；将任何同时包含exp函数和l og函数的特征丢弃；当给定的数据中的特征值由正负值组成，则将l og函数和√函数丢弃；当所述特征空间中特征的值的绝对值大于40， exp函数不会被应用；方程的项数小于 6； exp函数和l og函数不同时出现在一个方程中；同一个元素函数不允许出现在方程的所有项中；方程中的元素类型小于等于4；当方程不满足上述规则，则将方程丢弃。 4.如权利要求1所述的一种基于机器学习的公式模型构建方法，其特征在于，所述步骤 S5具体包括以下子步骤：步骤S51：对于每个所述候选方程，将每个变量循环处理为因变量，将其他变量的数据代入方程求解，计算所述因变量的值与用户给定数据中相应的值之间的误差，当所述误差权　利　要　求　书 1/2 页 2 CN 115292672 A 2大于预设临界值，则所述候选方程对用户给定数据中相应的值的检验是失败的，所述因变量属于离群值，将所述候选方程丢弃；反之，得到多个最优方程；步骤S52：利用定义分数、所述最优方程中的变量个数、所述最优方程中的最大项数、所述最优方程中重新检验的总次数、所述最优方程的个数和所述最优方程的复杂度构建评估公式；步骤S53：利用所述评估公式对所述组合空间中的函数列表进行穷举搜索，获得更新后的分数；步骤S54：将定义分数与更新后的分数组合为总分数，所述总分数排序靠前的所述候选方程即为最终结果。 5.如权利要求1所述的一种基于机器学习的公式模型构建方法，其特征在于，所述专家知识包括以下一种或任意多种函数：矩阵基本操作相关函数、矩阵分解的相关函数、同矩阵相关的基本数学函数、数据分析相关函数、数值微积分相关函数、随机数相关函数、随机变量的描述相关函数、随机变量的累积概率相关函数、随机变量的逆累积分布相关函数、随机变量的数字特征相关函数、参数估计相关函数、假设检验相关函数、统计与概率相关函数。 6.如权利要求1所述的一种基于机器学习的公式模型构建方法，其特征在于，所述待选基元函数集合包括幂函数和基元函数，所述基元函数由用户初始设置，所述基元函数为 log、 exp、 sqr t和/或si n，默认为 None，即不添加基元函数，仅进行幂函数组合。 7.一种基于机器学习的公式模型构建系统，其特征在于，包括：隐式方程构建模块：用于对用户给定的数据和待选基元函数集合，基于专家知识构建隐式方程，对所述隐式方程中的变量进行无量纲化处理，得到无量纲变量；组合空间构建模块：用于根据所述待选基元函数集合，通过穷举组合构建各类项特征的特征空间进行组合，得到组合空间；专家知识约束模块：用于对所述特征空间中各特征项及由各特征项组成的方程通过所述专家知识进行约束，获取方程的组合空间；候选方程构建模块：用于当所述组合空间中的方程组合数量超过预设阈值，则利用演化计算或LASSO回归的机器学习方法对所述组合空间中的方程进行回归系数求解；反之，则使用矩阵的伪逆方法对所述组合空间中的方程进行系数求解；最终，得到多个候选方程；结果输出模块：用于通过预设的评价公式，求解所述候选方程的评价系数，根据所述评价系数评价所述候选方程，排序靠前的所述候选方程即为最终结果。 8.一种基于机器学习的公式模型构建装置，其特征在于，包括存储器和一个或多个处理器，所述存储器中存储有可执行代码，所述一个或多个处理器执行所述可执行代码时，用于实现权利要求1 ‑6中任一项所述的一种基于机器学习的公式模型构建方法。 9.一种计算机可读存储介质，其特征在于，其上存储有程序，该程序被处理器执行时，实现权利要求1 ‑6中任一项所述的一种基于机器学习的公式模型构建方法。权　利　要　求　书 2/2 页 3 CN 115292672 A 3

专利 一种基于机器学习的公式模型构建方法、系统及装置

专利一种基于机器学习的公式模型构建方法、系统及装置