全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111413022.7 (22)申请日 2021.11.25 (71)申请人 天津大学 地址 300072 天津市南 开区卫津路9 2号 (72)发明人 许林英 曾新  (74)专利代理 机构 天津市北洋 有限责任专利代 理事务所 12 201 代理人 潘俊达 (51)Int.Cl. G06F 30/27(2020.01) G06F 30/17(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 111/08(2020.01) (54)发明名称 一种基于自编码与梯度提升树组合算法对 钻孔的判断方法 (57)摘要 本发明属于互联网技术领域, 具体公开了一 种基于自编码与梯度提升树组合算法对钻孔的 判断方法, 包括: 步骤1: 对钻孔样本数据进行归 一化处理; 步骤2: 将钻孔数据集D={X1, X2, ..., Xn‑1, Xn}划分为训练集D1和测试集D2; 步骤3: 基于 无标签的训练集D1, 对训练集D1进行栈式自编码 层训练, 将钻孔数据处理进行降维处理, 并输出 隐藏层的数据; 步骤4: 对隐藏层的数据和带标签 的训练集D1进行处理, 一起进入梯度提升决策树 中进行训练, 设置残差函数; 步骤5: 输出层是输 出决策树训练后的最优模型。 其能够实现钻孔合 格性批量判断的功能, 为地浸采矿 人员减少地浸 井场钻孔设计工作量, 提高地浸井场钻孔设计质 量, 该算法模 型可以提高测井数据中钻孔判断的 效率和准确率。 权利要求书2页 说明书6页 附图4页 CN 114065647 A 2022.02.18 CN 114065647 A 1.一种基于自编码与梯度提升树组合算法对钻孔的判断方法, 其特征在于, 包括以下 步骤: 步骤1: 对 钻孔样本数据进行归一 化处理; 步骤2: 将钻孔数据集D={X1, X2, ..., Xn‑1, Xn}划分为训练集D1和测试集D2, 训练集D1在 所钻孔数据集D中出现的概 率为 且m为训练集D1中的样本数量; 步骤3: 将部分训练集D1通过人工贴上标签, 将无标签的训练集D1进行栈式自编码层训 练, 将钻孔数据处 理进行降维处 理, 并输出隐藏层的数据; 步骤4: 对隐藏层的数据和带标签的训练集D1进行处理, 一起进入梯度提升 决策树中进 行训练, 设置残差函数; 步骤5: 输 出层是输 出决策树训练后的最优模型, 并对测试集D2进行训练, 判断模型的性 能。 2.根据权利要求1的一种基于自编码与梯度提升树组合算法对钻孔的判断方法, 其特 征在于, 在步骤1中, 对 钻孔数据进行归一 化处理, 具体如下: 找到钻孔样本数据中的最小值和最大值, 然后将钻孔样本数据转化为区间[0, 1]之间 的数据, 计算公式如下: 其中, X为钻孔样本数据, X ′为归一化的数据, X ′∈[0, 1], XMIN代表钻孔样本数据中的最 小值, XMAX代表钻孔样本数据中的最大值。 3.根据权利要求1的一种基于自编码与梯度提升树组合算法对钻孔的判断方法, 其特 征在于, 在步骤2中, 将钻孔 数据集D={X1, X2, ..., Xn‑1, Xn)划分为训练集D1和测试集D2, 训练 集D1在所钻孔数据集D中出现的概率为 且m为训练集D1中的样本数量; 具 体如下: 每次从钻孔数据集D中随机选 择一个样本放入到训练集D1, 然后再把样本放回钻 孔数据 集D中, 重复操作m次, 训练集D1具有m个样本数据, 训练集D1和测试集D2满足以下关系式; D=D1∪D2 即, D2=D‑D1, 训练集D1在钻孔数据集D中出现的概率为 当m→∞时, 训练集D1 为钻孔数据集D的3 6.8%。 4.根据权利要求1的一种基于自编码与梯度提升树组合算法对钻孔的判断方法, 其特 征在于, 在步骤 3中, 将部分训练集D1通过人工贴上标签, 将无标签的训练集D1进行栈式自编 码层训练, 将钻孔数据处 理进行降维处 理, 并输出隐藏层的数据, 具体如下: 用无标签的训练集D1作为输入, 训练出第一个隐含层结构的网络参数, 并通过训练好的 参数W(l, 1)和参数b(l, 1)算出第一个隐含层的输出; 把第一个隐含层的输出作为第二个网络 的输入, 训练第二个隐含层结构的网络参数, 并通过训练好的参数W(l, 1)和参数b(l, 1)算出第 二个隐含层的输出, 以此类推, 直到第n层训练完成, 其中参数W(l, 1)和参数b(l, 1)为第l个编 译器的参数, 第l层的编码过程如下:权 利 要 求 书 1/2 页 2 CN 114065647 A 2a(l)=f(z(l)) z(l+1)=W(l, 1)a(l)+b(l, 1) 其中, z为上一个神经网络层的输出数据, W为神经网络层中的权重, b为神经网络层中 的偏置项, f为激活函数, a为经 过激活函数处 理的输出 数据。 5.根据权利要求4的一种基于自编码与梯度提升树组合算法对钻孔的判断方法, 其特 征在于: 激活函数f的表达式如下: 其中, e为自然常数。 6.根据权利要求1的一种基于自编码与梯度提升树组合算法对钻孔的判断方法, 其特 征在于: 在步骤4中, 对隐藏层的数据和带标签 的训练集D1进行处理, 一起进入梯度提升决 策树中进行训练, 设置残差函数; 具体如下: S1、 输入钻孔数据集D={(x1, y1), (x2, y2), (x3, y3), ..., (xn, yn)}; S2、 初始化弱分类 器 S3、 对于K 棵树计算残差, 具体如下: 计算残差 对于i=1, 2, ...., n, 需要对数据(xi, rk, i)进行拟合得到K个回归 树, 每棵回归树的叶子 区域记为Rk, j, 其中j=1, 2, ..., JK, j代表每棵树的叶子节点的个数, JK表示第K棵树的叶子 节点个数。 拟合 值 更新fk(x), 且 S4、 输出分类树fK(x), 其中, D为钻孔数据集, f0(x)为第一个弱分类器的值, K为模型初始设置的回归树的数 目, rk, i为每棵树的残差, Rk, j为叶子区域, JK为第K棵树的叶子节点个数, Ck, j为数据(xi, rk, i) 的拟合值。 fk(x)为第k个强学习器。权 利 要 求 书 2/2 页 3 CN 114065647 A 3

.PDF文档 专利 一种基于自编码与梯度提升树组合算法对钻孔的判断方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于自编码与梯度提升树组合算法对钻孔的判断方法 第 1 页 专利 一种基于自编码与梯度提升树组合算法对钻孔的判断方法 第 2 页 专利 一种基于自编码与梯度提升树组合算法对钻孔的判断方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:26:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。