全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211201005.1 (22)申请日 2022.09.29 (71)申请人 中银金融科技 (苏州) 有限公司 地址 215133 江苏省苏州市高铁新城南天 成路55号相融大厦18层1802室 (72)发明人 张泽群 叶芸 温海如  (74)专利代理 机构 上海科盛知识产权代理有限 公司 312 25 专利代理师 陈金星 (51)Int.Cl. G06K 9/62(2022.01) G06N 5/00(2006.01) G06N 20/00(2019.01) (54)发明名称 一种决策树模 型特征重要性计算方法、 装置 及存储介质 (57)摘要 本发明涉及一种决策树模型特征重要性计 算方法、 装置及存储介质, 包括以下步骤: 获取一 个训练好的决策树模型; 对所述决策树模型进行 结构解析, 获取计算特征重要性所需的模型信 息; 其中, 所述模型信息中包括节点深度信息、 节 点最佳划分特征和节点增益信息; 将所述模型信 息储存为向量; 基于所述向量计算特征重要性, 并输出特征重要性向量。 与现有技术相比, 本发 明计算特征重要性时引入了决策树的节点深度, 并给出了合理的计算公式, 得到的特征重要性准 确度更高, 更加符合特征对预测结果的实际贡 献。 权利要求书2页 说明书8页 附图3页 CN 115510981 A 2022.12.23 CN 115510981 A 1.一种决策树模型 特征重要性计算方法, 其特 征在于, 包括以下步骤: 获取一个训练好的决策树模型; 对所述决策树模型进行结构解析, 获取计算特征重要性所需的模型信 息; 其中, 所述模 型信息中包括节点深度信息; 将所述模型信息储 存为向量; 基于所述向量计算特 征重要性, 并输出 特征重要性向量。 2.根据权利要求1所述的一种决策树模型特征重要性计算方法, 其特征在于, 对于单棵 决策树模型, 定义 其特征重要性向量 为: FI=[FI1, FI2, ..., FIk, ..., FIK] 定义决策树节点深度向量 为: D=[d1, d2, ..., dn, ..., dN] 其中K表示决策树模型的总特征数量, FIk表示特征fk的特征重要性, k∈{1, 2, 3, ..., K}; N表示决策树模型的总节点数量, dN表示节点 N的节点深度; 特 征重要性的计算公式为: 其中j表示节点值, 表示使用特征fk作为节点最佳划分特征的节点集合, 且 Gj表示节点j增益的向量。 3.根据权利要求2所述的一种决策树模型特征重要性计算方法, 其特征在于, 所述节点 j增益的向量Gj的计算公式为: 其中Oj表示节点j的目标函数, Ojl和Ojr分别表示节点j分裂后的左子节点和右子节点的 目标函数值; Cj表示节点j中的样本数量, Cjl和Cjr分别表示节点j的左子节点的样本数量和 右子节点的样本数量。 4.根据权利要求3所述的一种决策树模型特征重要性计算方法, 其特征在于, 所述Cj、 Cjl及Cjr之间满足: Cj=Cjl+Cjr。 5.根据权利要求1所述的一种决策树模型特征重要性计算方法, 其特征在于, 对于包含 T棵树的集成决策树模型, T>1, 定义 其中第t棵决策树的特 征重要性向量 为: FIt=[FIt1, FIt2, ..., FItk, ..., FItK] 定义第t颗决策树的节点深度向量 为: Dt=[dt1, dt2, ..., dtn, ..., dtN] 集成决策树模型的特 征重要性向量 为: 其中K表示第t颗决策树模型的总特征数量, FItk表示特征ftk的特征重要性, k∈{1, 2,权 利 要 求 书 1/2 页 2 CN 115510981 A 23, ..., K}, N表示第t颗决策树模型的总节点 数量, dtN表示第t颗决策树中节点N的节点深度; 在集成决策树模型中, 特 征重要性的计算公式为: 其中j表示第t棵决策树的节点值, 表示使用特征fk作为节点最佳划分特征的节点 集合, 且 Gj表示第t棵决策树中节点j增益的向量。 6.根据权利要求5所述的一种决策树模型特征重要性计算方法, 其特征在于, 所述第t 棵决策树中节点j增益的向量Gtj的计算公式为: 其中Otj表示第t棵决策树中节点j的目标函数, Otjl和Otjr分别代表第 t棵决策树中节点j 分裂后的左 子节点和 右子节点的目标函数值; Ctj代表第t棵 决策树中节点j中的样本数量, Ctjl和Ctjr分别代表第t棵决策树中节点j的左子节点和右子节点的样本数量。 7.根据权利要求6所述 的一种决策树模型特征重要性计算方法, 其特征在于, 所述Ctj、 Ctjl及Ctjr之间满足: Ctj=Ctjl+Ctjr。 8.根据权利要求1所述的一种决策树模型特征重要性计算方法, 其特征在于, 所述的模 型信息还 包括节点 最佳划分特 征和节点增益信息 。 9.一种决策树模型特征重要性计算装置, 其特征在于, 包括存储器和处理器, 所述存储 器存储有计算机程序, 所述处理器调用所述程序指 令能够执行如权利要求 1至8任一所述的 决策树模型 特征重要性计算方法。 10.一种计算机可读存储介质, 其特征在于, 包括计算机程序, 所述计算机程序能够被 处理器执行以实现如权利要求1至8任一所述的决策树模型 特征重要性计算方法。权 利 要 求 书 2/2 页 3 CN 115510981 A 3

.PDF文档 专利 一种决策树模型特征重要性计算方法、装置及存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种决策树模型特征重要性计算方法、装置及存储介质 第 1 页 专利 一种决策树模型特征重要性计算方法、装置及存储介质 第 2 页 专利 一种决策树模型特征重要性计算方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:09:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。