全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210952926.5 (22)申请日 2022.08.09 (71)申请人 北京交通发展研究院 地址 100073 北京市西城区广安门内大街 317号 (72)发明人 何巍楠 郑晓彬 程颖 余柳  周瑜芳 王聘玺 韩媛 李逸伦  明菲菲 任文睿 汪京 张硕晨  翟天磊 赵旭  (74)专利代理 机构 广州蓝晟专利代理事务所 (普通合伙) 44452 专利代理师 高学敏 (51)Int.Cl. G08G 1/01(2006.01) G06V 20/62(2022.01)G06V 20/54(2022.01) G06Q 50/26(2012.01) G06Q 10/06(2012.01) G06F 16/587(2019.01) G06F 16/583(2019.01) G06F 16/58(2019.01) G06F 16/55(2019.01) (54)发明名称 一种面向路网排放核算的多层级卡口质量 控制方法 (57)摘要 本发明提供了一种面向路网排放核算的多 层级卡口质量控制方法, 属于交通卡口质量控制 技术领域, 用于解决现有卡口质量控制方法获取 的数据质量较差的技术问题。 本方法包括数据质 量控制处理和数据质量提升处理, 在对卡口的情 况进行预调查的基础上,对卡口数据进行处理、 分类以及 整理并将对数据源进行分析, 然后对错 误数据进行分类, 将错误数据分为卡口级、 卡口 群级和区域级, 对每一级的错误数据进行识别和 致因分析并在网络层面进行综合质量评估; 最后 对错误数据进行修正及补充, 根据不同类型的问 题数据进行修复, 建立提升数据质量的方法; 本 发明对数据进行分类整理, 并对问题数据进行精 准修复, 从而提高数据质量, 便于路网排放的精 准核算。 权利要求书3页 说明书7页 附图3页 CN 115376315 A 2022.11.22 CN 115376315 A 1.一种面向路网排放核算的多层级卡口质量控制方法, 其特征在于, 多层级卡口质量 控制方法包括数据质量控制处 理和数据质量 提升处理, 多层级卡口质量控制的步骤如下: 步骤一, 资料整理与现状分析, 包括对卡口的情况进行预调查、 对卡口数据进行处理、 对卡口数据进行分类以及整理数据并将对数据源进行分析; 对卡口的情况进行预调查: 对卡口现场调查的光线, 位置以及录像清晰度有初步的判 断, 以提高实际调查的质量; 对卡口数据进行处理: 一条卡口数据至少包括以下字段: 拍摄卡口、 拍摄时间、 车牌和 车型以及卡口的地理位置; 在所给卡口数据中删除经纬度异常的车辆, 进一步筛选出主路 卡口; 对卡口数据进行分类: 将卡口数据划分为三个等级, 分别是卡口级、 卡口群以及区域 级; 其中, 卡口级指的是 单个卡口; 卡口群包括: 干线群 ‑多个相邻卡口构成上下游且两两之间无岔路; 交叉口群 ‑位于同 一交叉口但不同进出道; 广义节点群 ‑满足流量守恒的多个卡口, 等效为 一个卡口; 区域级是指由多个卡口群构成, 且形成较为独立的功能 区; 步骤二, 通过错误数据分类、 识别、 致因分析, 建立错误数据识别 模型; 建立错误数据识 别模型包括错误识别方法的建立、 错误识别方法校验、 错误数据分类及致因分析、 数据质量 及可靠性评估; 对错误数据进行分类, 首先将错误数据分为卡口级、 卡口群级和区域级, 然 后对每一级的错 误数据进行识别和致因分析, 最后在网络层面进行综合质量评估; 对错误数据进行分类, 整理后得到的结果 为: 卡口级: (1)重复记录; (2)部分字段缺失记录; (3)错 误记录; 卡口群级: (1)多重记录: 某时间段内同一号牌在上下游卡口同时出现的数据记录; (2) 异常记录: 某 时间段内同一号牌以异常速度出现在多个上下游卡口的数据记录, 或相邻的 上下游卡口数据出现严重不对称; (3)整条字段缺失记录; 区域级: (1)多重记录: 某时间段内同一号牌在多个卡口同时出现的数据记录; (2)异常 记录: 某时间段内同一号牌 以异常速度出现在多个卡口的数据记录; (3)整条字段缺失记 录; 步骤三, 数据的修正和补充, 包括基于数据错误类型的修复方法选择、 数据质量改善方 法测试及比选、 数据质量改善方法评估; 在 对错误数据识别的基础上, 对错误数据进 行修正 及补充, 找出卡口数据存在的问题, 问题类型包括缺失、 格式不一致、 重复、 异常, 针对这些 问题, 建立 提升数据质量的方法; 步骤四, 针对卡口数据出现的问题 依次进行清洗 。 2.根据权利要求1所述的一种面向路网排放核算的多层级卡口质量控制方法, 其特征 在于, 所述步骤一中, 整理数据并将对 数据源进 行分析, 包括采集方法及字段信息介绍和数 据特征, 数据特 征包括错误类型、 分布特 征、 精度。 3.根据权利要求1所述的一种面向路网排放核算的多层级卡口质量控制方法, 其特征 在于, 所述步骤一中, 对卡口的情况进行预调查, 预调查的要素有: 卡口附近有没有其他卡 口, 能较容易分辨; 卡口附近是否有过街天桥, 方便录像调查; 经过卡口的车辆类型是否比 较齐全; 卡口点 位到学校距离是否适中。权 利 要 求 书 1/3 页 2 CN 115376315 A 24.根据权利要求2所述的一种面向路网排放核算的多层级卡口质量控制方法, 其特征 在于, 所述步骤二中, 网络层面综合质量评估是基于历史卡口数据、 交调数据的货运通道及 货运网络进行 数据的提取, 依靠复杂网络理论进行权 重确定, 最后进行加权 评价。 5.根据权利要求4所述的一种面向路网排放核算的多层级卡口质量控制方法, 其特征 在于, 所述 步骤二中, 数据质量及可靠性评估指标包括 缺失率和异常率; (1)缺失率是指某段时间范围内某 交通调查设备未采集到数据的数量占该时段内该交 通调查设备理论上应该采集到的数据量的百分比, 一条数据至少包括了以下字段: 拍摄卡 口、 拍摄时间、 车牌和车 型以及卡口 的地理位置; 缺失率计算公式如下: 上式中, Im: 缺失率; Dm: 某段时间范围内某交通调查设备 未采集到数据的数量; Dt: 该时段内该交通调查设备理论上应该采集到的数据量; (2)异常率 异常率指某时段内在筛选出的问题数据量占该时段内实际采集到的数据数量的百分 比, 异常率计算公式如下: 上式中, If: 错误率; Df: 某时段内筛 选出的问题数据量; D: 该时段内实际采集到的数据数量。 6.根据权利要求4所述的一种面向路网排放核算的多层级卡口质量控制方法, 其特征 在于, 所述步骤二中, 错误识别方法包括单点识别和多点识别, 多点识别包括多点同时识 别、 轨迹断片识别、 多 条同时缺失识别和异常逻辑识别; 对于数据质量及可靠性评估包括单 点评估、 卡口群评估和区域评估; 对错误数据的致因分析包括潜在因素和致因推理; 步骤三 中, 对于数据的质量提升包括单点修复和多点修复, 顺序上来说, 对 单个卡口数据进 行单点 修复后, 对于卡口群和区域级数据根据相似矩阵和时空关联性进行多点 修复。 7.根据权利要求1或6所述的一种面向路网排放核算的多层级卡口质量控制方法, 其特 征在于, 所述步骤三中数据错误类型 的修复方法包括基于仿真模型修复法、 基于预测原理 修复法、 基于插值原理修复法和基于统计学习修复法; 基于仿真模型修复法: 通过建立仿真模型对错 误数据进行修复; 基于预测原理修复法: 在检测点位的历史数据基础上建立预测模型, 并利用模型的预 测值来替换该检测点 位当前的问题数据或填补缺失数据; 基于插值原理修复法: 基于历史或近邻数据利用现有插值方法进行填补; 通过从同一 检测位所获取的前几天同一时刻的数据通过加权平均来修复有问题的数据, 或通过参考近 邻几个检测点位的数据, 并通过平均或是加权平均来估计缺失或被污染的数据, 进行修复; 基于统计学习修复法: 将要修复的数据视作为一个待估参数, 通过多次抽样的方式来 估计该数据的替代值, 进行修复。 8.根据权利要求1或6所述的一种面向路网排放核算的多层级卡口质量控制方法, 其特权 利 要 求 书 2/3 页 3 CN 115376315 A 3

PDF文档 专利 一种面向路网排放核算的多层级卡口质量控制方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向路网排放核算的多层级卡口质量控制方法 第 1 页 专利 一种面向路网排放核算的多层级卡口质量控制方法 第 2 页 专利 一种面向路网排放核算的多层级卡口质量控制方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:41:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。