全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111266699.2 (22)申请日 2021.10.27 (71)申请人 北京闪送科技有限公司 地址 100085 北京市海淀区永 泰庄北路1号 天地邻枫6号楼1层104-1 15室 (72)发明人 薛鹏 于红建 余进  (51)Int.Cl. G06Q 10/06(2012.01) G06Q 10/08(2012.01) G06N 20/00(2019.01) G06K 9/62(2022.01) (54)发明名称 一种基于机器学习模型的供需调度策略融 合应用 (57)摘要 本发明涉及一种基于机器学习模型的供需 调度策略融合应用。 所属方法通过融合逻辑回归 算法模型预测订单于运力之间的接单概率, 在业 务流程过程中通过运力的召回、 过滤、 排序三大 步骤计算最佳的订单于运力的组合, 从而达到平 台分单效率的最优。 在接单率预测过程中按照标 准流程对数据进行归一化、 空值处理等基本预处 理过程, 然后通过训练好的模型实时预测出当前 订单与运力之间的接单率, 该模式的实现极大的 优化了平台接单效率以及接单率, 保证了平台在 时空维度上的分单匹配最优化。 权利要求书1页 说明书3页 附图2页 CN 114048978 A 2022.02.15 CN 114048978 A 1.一种基于 机器学习模型的供需调度策略融合应用, 其特 征在于, 包括以下步骤: A: 确定业 务特征统计口径, 收集相关数据结果; B: 确定特 征选择方案, 筛选效果优异特 征; C: 建立特 征工程流程, 将数据转 化为算法可理解和 消化的数据; D: 对比离线数据各算法效果; E: 算法线上 灰度效果评估, 选择表现最优算法进行正式上线。 2.根据权利要求1所述的基于机器学习 模型的供需调度策略融合应用, 其特征在于: 所 述步骤A具体包括 步骤: A1: 根据以往业务经验将特征分为用户、 运力、 订单、 城市、 天气五大类特征, 基于每类 特征的性质及属性又可继续进 行细分, 最 终确定相关特征数量超过100种, 结合业务性质梳 理现有特 征并确定特 征统计周期以及统计标准。 A2: 基于A1中确定的特征以及对应统计口径准备相关数据, 结合业务数据对样本数据 进行标注, 标注数据以订单派单后是否被运力接起为准。 同时对样本数据进行随机抽样, 筛 选10000条数据。 3.根据权利要求1所述的基于机器学习 模型的供需调度策略融合应用, 其特征在于: 所 述步骤B具体包括步骤: 为了避免维度灾难, 在保证训练结果的前提下需要降低机器学习的 计算复杂度, 特征的筛选则尤为重要。 在进 行特征筛选的时候, 可以利用多种方法(例如: 皮 尔森系数、 卡方检验、 决策树算法等)对特征进行可用性评估, 进而筛选与目标结果相关性 高的特征, 剔除相似度高的冗余特 征。 4.根据权利要求1所述的基于机器学习 模型的供需调度策略融合应用, 其特征在于: 所 述步骤C具体包括 步骤: C1: 为降低数据缺失对模型准确性的影响, 需采取众数填充、 均值填充、 中位数填充、 KNN聚类填充、 固定值填充、 上下文填充、 直接剔除等方法填充缺 失值。 根据业务场景及算法 需求确定对应填充方法。 C2: 借鉴经验、 箱型图异常值法以及 原则法进行异常值剔除。 C3: 借鉴label编码、 o ne hot编码、 embed ding方法进行离 散数据处 理。 C4: 连续数据分桶处 理。 C5: 数据正态化/归一 化处理。 C6: 样本按照6∶2 ∶2比例随机划分为训练集、 验证集、 测试集 三个层级。 5.根据权利要求1所述的基于机器学习 模型的供需调度策略融合应用, 其特征在于: 所 述步骤D具体包括 步骤: D1: 确定所选算法名单, 其主要包含(岭回归、 Lasso、 LR、 FM、 svm、 贝叶斯分类器、 Adaboost、 lightgbm等) D2: 确定衡量算法优劣的相关指标, 基于指标对各算法进行排名, 筛选排名前五的算法 进行线上测试。 6.根据权利要求1所述的基于机器学习 模型的供需调度策略融合应用, 其特征在于: 所 述步骤E具体包括步骤: 线上算法观察周期定为2周, 观察指标定为线上整体接单率, 根据2 周平均接单率高低作为选择模型的标准。权 利 要 求 书 1/1 页 2 CN 114048978 A 2一种基于机 器学习模型的供需调度策略融合应用 所属技术领域 [0001]本发明涉及 一种基于机器学习模型的供需调度策略融合应用, 属于分单优化与智 能调度研究技 术领域。 背景技术 [0002]即时配送, 是一种配送时长1小时以内, 平均配送时长约30分钟的快速配送业务。 如此快速的配送时效, 将传统的线上电商交易与线下物流配送(传统划分比较明确的两条 业务)整合为统一整体, 形成了用户、 骑手和平台互相交错的三元关系。 即时物流分布式系 统架构逐层演变的进展中, 遇到的技术障碍和挑战: 订单、 骑手规模大, 供需匹配过程的超 大规模计算问题。 遇到节假日或者恶劣天气, 订单聚集效应, 流量高峰是平常的十几倍。 物 流履约是线上连接线下 的中心调度, 体现在派单制上, 即依据一系列 因素算出一个或者一 批效率最优解直接派单。 对于配送系统来说, 比较大 的挑战还是对识别精度的要求以及成 本之间的平衡。 我们对精度要求很高, 毕竟这些识别直接影响定价、 调度、 判责系统, 这种底 层数据, 精度不高带来的问题很大。 [0003]高效匹配其中一个的关键点是按需分配, 识别用户的准确需求, 并在众多资源当 中匹配到最合适的。 为了做到高效匹配, 平台从每日订单中积累了大量来自司机和用户的 信息, 包括它们的行程路线、 行为习惯、 特殊需求等等, 除此之外, 还有对整个城市交通状况 的了解, 做到提前预测需求, 然后确保供应量与将要达到的需求量相匹配, 这样可以以一个 最佳的方式来激活 闲置资源。 [0004]调度平台真正要解决的就是如何提高匹配效率。 平台初期可能更靠补贴和地推去 抢市场, 到了后期, 匹配效率的提升是最重要的, 只有匹配合适的出行资源, 才能让客户的 需求得到最大限度的满足。 同样的, 在 蚂蚁金服客户服务的智能调度当中, 如何让用户的需 求得到最准确的匹配, 并且保证相应资源的可用性, 解决了这些问题, 才能最大限度的实现 用户期望 。 [0005]地理信息 实时更新(5秒钟发起一次请求), 描述整体资源的情况, 当用户发出订单 需求后, 第一时间根据资源情况, 进 行订单推送。 基于对历史数据的统计并结合实时订单数 据, 给出当前全城范围内订单密集区域的分布, 给骑手提供有价值的听单位置参考, 提高听 单概率并减少骑手空驶时间。 基于供需预测结果, 大规模有序调动全城所有可用运力, 实现 资源最优化分配。 在骑手和用户的历史数据中学习接单概率模型, 提高骑手和用户的匹配 度, 利用运力的规模效应实时地从全局上最优化总体交通运输效率和乘客出行体验。 故障 容忍度极低, 不能宕机, 不能丢单, 可用性要求极高。 数据实时性、 准确性要求高, 对延迟、 异 常非常敏感。 发明内容 [0006]本发明要解决的技术问题是: 如何实现基于机器学习模型的供需调度策略融合应 用。说 明 书 1/3 页 3 CN 114048978 A 3

.PDF文档 专利 一种基于机器学习模型的供需调度策略融合应用

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于机器学习模型的供需调度策略融合应用 第 1 页 专利 一种基于机器学习模型的供需调度策略融合应用 第 2 页 专利 一种基于机器学习模型的供需调度策略融合应用 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 18:59:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。