专利结合张量分解与梯度提升决策树的货量预测方法及系统

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111499804.7 (22)申请日 2021.12.09 (71)申请人浙江百世技术有限公司地址 310000 浙江省杭州市滨江区江南大道3850号3楼307室 (72)发明人陈沛林　周羽勍　龚鑫　 (74)专利代理机构杭州信与义专利代理有限公司 33450 代理人丁浩 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 10/08(2012.01) G06N 20/00(2019.01) (54)发明名称结合张量分解与梯度提升决策树的货量预测方法及系统 (57)摘要本发明公开了一种结合张量分解与梯度提升决策树的货量预测方法及系统，属于货量预测技术领域。本发明通过构建货量张量，并通过CP 分解对货量张量进行低秩近似，从而过滤噪声，并从始发转运中心、目的转运中心和日期这3个维度提取货量变化因子，然后通过将始发转运中心、目的转运中心这2个维度的货量变化因子整合到梯度提升决策树模型中，更好地利用了历史货量变化趋势，提升了梯度提升决策树模型的货量预测精度。实验表明，本发明在相同超参数下，相比较只用梯度提升决策树的货量预测方法可以获得更高的预测准确率。权利要求书2页说明书9页附图4页 CN 114169611 A 2022.03.11 CN 114169611 A 1.一种结合张量分解与梯度提升决策树的货量预测方法，其特征在于，步骤包括： S1，构建三维张量为实数集， O、 D、 T分别表示从样本集中提取的始发转运中心的集合、目的转运中心的集合以及日期的集合； S2，对所述张量进行CP分解后构建始发转运中心、目的转运中心和日期这3个维度上的因子矩阵，分别记为A、 B、 C，因子矩阵A、 B、 C中的每一行分别代表一个对应的始发转运中心维度、目的转运中心维度、日期维度上的货量变化因子； S3，将获取的所有流向的特征数据X中的始发转运中心这一类别特征替换为所述因子矩阵A中的对应该始发转运中心的行向量，将获取的所述特征数据X中的目的转运中心这一类别特征替换为所述因子矩阵B中的对应该目的转运中心的行向量，经特征替换后得到新的特征数据X′； S4，将所述特征数据X ′输入到基于梯度提升决策树训练的货量预测模型中，模型输出货量预测值 2.根据权利要求1所述的结合张量分解与梯度提升决策树的货量预测方法，其特征在于，步骤S2中，对所述张量进行CP分解并构建因子矩阵A、 B、 C的方法步骤包括： S21，给定所述张量的秩R，然后对所述张量进行CP分解，所述张量的CP分解形式通过以下公式(1)表达：公式(1)中，分别表示始发转运中心维度、目的转运中心维度和日期维度上的因子分量； r＝1,…,R；表示对向量作外积运算； S22，根据所分解的因子分量 ar、 br、 cr，分别构建始发转运中心维度、目的转运中心维度和日期维度的因子矩阵A、 B、 C，因子矩阵A、 B、 C分别表达如下： 3.根据权利要求2所述的结合张量分解与梯度提升决策树的货量预测方法，其特征在于， 2≤R≤ 6。 4.根据权利要求1所述的结合张量分解与梯度提升决策树的货量预测方法，其特征在于，训练所述货量预测模型的方法步骤包括： L1，将历史N天中所有流向的所述特征数据X以及X对应的实际货量数据Y划分为训练集和验证集，所述训练集中的所述特征数据X以及X对应的所述实际货量数据Y分别记为 Xtrain、 Ytrain，所述验证集中的所述特征数据X以及X对应的所述实际货量数据Y分别记为Xvalid、 Yvalid； L2，构建所述张量权　利　要　求　书 1/2 页 2 CN 114169611 A 2L3，对所述张量进行CP分解后构建始发转运中心、目的转运中心和日期这3个维度上的因子矩阵，分别记为A、 B、 C； L4，将Xtrain中的始发转运中心这一类别特征替换为因子矩阵A中的对应该始发转运中心的行向量，将Xtrain中的目的转运中心这一类别特征替换为因子矩阵B中的对应该目的转运中心的行向量，得到新的特征数据Xtrain′；将Xvalid中的始发转运中心这一类别特征替换为因子矩阵A中的对应该始发转运中心的行向量,将Xvalid中的目的转运中心这一类别特征替换为因子矩阵B中的对应该目的转运中心的行向量，得到新的特征数据Xvalid′； L5，分别以(Xtrain′,Ytrain)、 (Xvalid′,Yvalid)为货量预测模型训练的训练集和验证集，使用梯度提升决策树训练形成所述货量预测模型。 5.根据权利要求4所述的结合张量分解与梯度提升决策树的货量预测方法，其特征在于， N＝800。 6.根据权利要求4或5所述的结合张量分解与梯度提升决策树的货量预测方法，其特征在于，选择历史N 天中的N′天的所述特征数据X以及X对应的实际货量数据Y作为验证所训练的所述货量预测模型的性能的验证集， 0.0 5N≤N′≤0.1N。 7.一种结合张量分解与梯度提升决策树的货量预测系统，可实现如权利要求1 ‑6任意一项所述的货量预测方法，其特征在于，所述货量预测系统包括：数据提取模块，用于根据数据提取指令从样本集中提取出始发转运中心、目的转运中心和日期，并分别形成始发转运中心集合O、目的转运中心集合D和日期集合T；三维张量构建模块，连接数据提取模块，用于以数据提取完成为指令，根据提取到的集合O、 D、 T构建三维张量张量分解模块，连接所述三维张量构建模块，用于以完成张量构建为指令对所述张量进行CP分解，得到对应始发转运中心维度、目的转运中心维度和日期维度的因子分量ar、 br、 cr 因子矩阵构建模块，连接所述张量分解模块，用于以完成张量分解为指令，根据所分解的因子分量ar、 br、 cr，构建始发转运中心、目的转运中心和日期这3个维度上的因子矩阵A、 B、 C，因子矩阵A、 B、 C中的每一行分别代表一个对应的始发转运中心、目的转运中心、日期的货量变化因子；特征替换模块，连接所述因子矩阵构建模块，用于将获取的特征数据 X中的始发转运中心这一类别特征替换为所述因子矩阵A中的对应该始发转运中心的行向量，并用于将获取的所述特征数据X中的目的转运中心这一类别特征替换为所述因子矩阵B中的对应该目的转运中心的行向量，经特征替换后得到新的特征数据X′；货量预测模块，连接所述特征替换模块，用于将所述特征数据X ′输入到基于梯度提升决策树训练的货量预测模型中，模型输出货量预测值 8.根据权利要求7所述的结合张量分解与梯度提升决策树的货量预测系统，其特征在于，所述货量预测系统还包括：模型训练模块，用于以所述特征数据X ′以及X′对应的实际货量数据Y为模型训练样本，并基于梯度提升决策树训练形成所述货量预测模型。权　利　要　求　书 2/2 页 3 CN 114169611 A 3

专利 结合张量分解与梯度提升决策树的货量预测方法及系统

专利结合张量分解与梯度提升决策树的货量预测方法及系统