全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111499804.7 (22)申请日 2021.12.09 (71)申请人 浙江百世技 术有限公司 地址 310000 浙江省杭州市滨江区江南大 道3850号3楼307室 (72)发明人 陈沛林 周羽勍 龚鑫  (74)专利代理 机构 杭州信与义专利代理有限公 司 33450 代理人 丁浩 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 10/08(2012.01) G06N 20/00(2019.01) (54)发明名称 结合张量分解与梯度提升决策树的货量预 测方法及系统 (57)摘要 本发明公开了一种结合张量分解与梯度提 升决策树的货量预测方法及系统, 属于货量预测 技术领域。 本发明通过构建货量张量, 并通过CP 分解对货量张量进行低秩近似, 从而过滤噪声, 并从始发转运中心、 目的转运中心和日期这3个 维度提取货量变化因子, 然后通过将始发转运中 心、 目的转运中心这2个维度的货量变化因子整 合到梯度提升决策树模型中, 更好地利用了历史 货量变化趋势, 提升了梯度提升决策树模型的货 量预测精度。 实验表明, 本发明在相同超参数下, 相比较只用梯度提升决策树的货量预测方法可 以获得更高的预测准确率。 权利要求书2页 说明书9页 附图4页 CN 114169611 A 2022.03.11 CN 114169611 A 1.一种结合张量分解与梯度提升决策树的货量预测方法, 其特 征在于, 步骤 包括: S1, 构建三维张量 为实数集, O、 D、 T分别表示从样本集中提取的 始发转运中心的集 合、 目的转 运中心的集 合以及日期的集 合; S2, 对所述张量 进行CP分解后构建始发转运中心、 目的转运中心和日期这3个维度上 的因子矩阵, 分别记为A、 B、 C, 因子矩阵A、 B、 C中的每一行分别代表一个对应的始发转运中 心维度、 目的转 运中心维度、 日期维度上的货量变化因子; S3, 将获取的所有流向的特征数据X中的始发转运中心这一类别特征替换为所述因子 矩阵A中的对应该始发转运中心的行向量, 将获取的所述特征数据X中的目的转运中心 这一 类别特征替换为所述因子矩阵B中的对应该目的转运中心的行向量, 经特征替换后得到新 的特征数据X′; S4, 将所述特征数据X ′输入到基于梯度提升决策树训练的货量预测模型中, 模型输出 货量预测值 2.根据权利要求1所述的结合张量分解与梯度提升决策树的货量预测方法, 其特征在 于, 步骤S2中, 对所述张量 进行CP分解并构建因子矩阵A、 B、 C的方法步骤 包括: S21, 给定所述张量 的秩R, 然后对所述张量 进行CP分解, 所述张量 的CP分解形式 通过以下公式(1)表达: 公式(1)中, 分别表示始发转运中心维度、 目的转运中 心维度和日期维度上的因子分量; r=1,…,R; 表示对向量作外积运 算; S22, 根据所分解的因子分量 ar、 br、 cr, 分别构建始发转运中心维度、 目的转运 中心维度 和日期维度的因子矩阵A、 B、 C, 因子矩阵A、 B、 C分别表达如下: 3.根据权利要求2所述的结合张量分解与梯度提升决策树的货量预测方法, 其特征在 于, 2≤R≤ 6。 4.根据权利要求1所述的结合张量分解与梯度提升决策树的货量预测方法, 其特征在 于, 训练所述货量预测模型的方法步骤 包括: L1, 将历史N天中所有流向的所述特征数据X以及X对应的实际货量数据Y划分为训练集 和验证集, 所述训练集中的所述 特征数据X以及X对应的所述实际货量 数据Y分别记为 Xtrain、 Ytrain, 所述验证集中的所述特征数据X以及X对应的所述实际货量数据Y分别记为Xvalid、 Yvalid; L2, 构建所述张量 权 利 要 求 书 1/2 页 2 CN 114169611 A 2L3, 对所述张量 进行CP分解后构建始发转运中心、 目的转运中心和日期这3个维度上 的因子矩阵, 分别记为A、 B、 C; L4, 将Xtrain中的始发转运中心这一类别特征替换为因子矩阵A中的对应该始发转运中 心的行向量, 将Xtrain中的目的转运中心这一类别特征替换为因子矩阵B中的对应该目的转 运中心的行向量, 得到新的特征数据Xtrain′; 将Xvalid中的始发转运中心这一类别特征替换 为因子矩阵A中的对应该始发转运中心的行向量,将Xvalid中的目的转运中心这一类别特征 替换为因子矩阵B中的对应该目的转 运中心的行向量, 得到新的特 征数据Xvalid′; L5, 分别以(Xtrain′,Ytrain)、 (Xvalid′,Yvalid)为货量预测模型训练的训练集和验证集, 使 用梯度提升决策树训练形成所述货量预测模型。 5.根据权利要求4所述的结合张量分解与梯度提升决策树的货量预测方法, 其特征在 于, N=800。 6.根据权利要求4或5所述的结合张量分解与梯度提升决策树的货量预测方法, 其特征 在于, 选择历史N 天中的N′天的所述特征数据X以及X对应的实际货量数据Y作为验证所训练 的所述货量预测模型的性能的验证集, 0.0 5N≤N′≤0.1N。 7.一种结合张量分解与梯度提升决策树的货量预测系统, 可实现如权利要求1 ‑6任意 一项所述的货量预测方法, 其特 征在于, 所述货量预测系统包括: 数据提取模块, 用于根据数据提取指令从样本集中提取出始发转运中心、 目的转运中 心和日期, 并分别形成始发转 运中心集 合O、 目的转 运中心集 合D和日期集 合T; 三维张量构建模块, 连接数据提取模块, 用于以数据提取完成为指令, 根据提取到的集 合O、 D、 T构建三维张量 张量分解模 块, 连接所述三维张量构建模 块, 用于以完成张量构建为指令对所述张量 进行CP分解, 得到对 应始发转运中心维度、 目 的转运中心维度和日期维度的因子分量ar、 br、 cr 因子矩阵构建模块, 连接所述张量分解模块, 用于以完成张量分解为指令, 根据 所分解 的因子分量ar、 br、 cr, 构建始发转运中心、 目的转运中心和日期这3个维度上的因子矩阵A、 B、 C, 因子矩阵A、 B、 C中的每一行分别代表 一个对应的始发转运中心、 目的转运中心、 日期的 货量变化因子; 特征替换模块, 连接所述因子矩阵构建模块, 用于将 获取的特征数据 X中的始发转运中 心这一类别特征替换为所述因子矩阵A中的对应该始发转运中心的行向量, 并用于将获取 的所述特征数据X中的目的转运中心这一类别特征替换为所述因子矩阵B中的对应该目的 转运中心的行向量, 经 特征替换后得到新的特 征数据X′; 货量预测模块, 连接所述特征替换模块, 用于将所述特征数据X ′输入到基于梯度提升 决策树训练的货量预测模型中, 模型输出货量预测值 8.根据权利要求7所述的结合张量分解与梯度提升决策树的货量预测系统, 其特征在 于, 所述货量预测系统还 包括: 模型训练模块, 用于以所述特征数据X ′以及X′对应的实际货量数据Y为模型训练样本, 并基于梯度提升决策树训练形成所述货量预测模型。权 利 要 求 书 2/2 页 3 CN 114169611 A 3

.PDF文档 专利 结合张量分解与梯度提升决策树的货量预测方法及系统

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 结合张量分解与梯度提升决策树的货量预测方法及系统 第 1 页 专利 结合张量分解与梯度提升决策树的货量预测方法及系统 第 2 页 专利 结合张量分解与梯度提升决策树的货量预测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:44:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。