(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210946507.0
(22)申请日 2022.08.09
(65)同一申请的已公布的文献号
申请公布号 CN 115018213 A
(43)申请公布日 2022.09.06
(73)专利权人 深圳市城市交通 规划设计 研究中
心股份有限公司
地址 518131 广东省深圳市龙华区民治街
道龙塘社区星河传奇花园三期商厦1
栋C座1210
(72)发明人 吕国林 林虹君 周燕宁 刘恒
杨湘绥 任浩
(74)专利代理 机构 哈尔滨市伟晨专利代理事务
所(普通合伙) 23209
专利代理师 李冬爽
(51)Int.Cl.
G06Q 10/04(2012.01)G06Q 50/26(2012.01)
G06F 16/215(2019.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(56)对比文件
CN 114372522 A,2022.04.19
CN 114626684 A,202 2.06.14
CN 113326971 A,2021.08.31
CN 104408907 A,2015.0 3.11
CN 110751311 A,2020.02.04
US 201325 3808 A1,2013.09.26
张莉.城市道路交通事故 持续时间预测 和事
故影响因素关系研究. 《中国优秀硕士学位 论文
全文数据库 工程科技 Ⅱ辑》 .2022,(第02期),第
C034-445页.
审查员 房琦
(54)发明名称
高速公路事故持续时间预测方法、 电子设备
及存储介质
(57)摘要
一种高速公路事故持续时间预测方法、 电子
设备及存储介质, 属于交通事故分析和预测领
域。 为提高高速公路事故持续时间的预测准确
性, 本发明步骤包括数据采集, 数据清洗, 变量分
类赋值, 利用LASSO算法筛选与事故持续时间相
关的变量, 利用链式方程多重插补MICE填充缺失
变量, 基于完整样本集构建事故持续时间预测模
型: 首先构建包含输入层、 两层隐藏层和输出层
的前馈神经网络对数据集进行映射处理, 然后构
建COX半参数模型, 用于高速公路事故持续时间
预测。 本发明基于深度学习的COX模型对丢失数
据有一定的容忍度, 深度学习的数据增强策略可
以使模型对数据集中常见的数据噪声和数据缺
失具有更强的弹性。
权利要求书3页 说明书11页 附图1页
CN 115018213 B
2022.11.25
CN 115018213 B
1.一种高速公路事故持续时间预测方法, 其特 征在于: 包括如下步骤:
S1、 数据采集: 收集k个道路交通事故数据样本, 从驾驶员、 车辆、 道路、 环境、 事故属性
五方面收集持续时间的影响因素, 构成样本集D=(d1, d2, ..., dk)T, 第i个交通事故样本di=
(d(i1), d(i2), ..., d(in)), d(in)为第i个交通事故样本的第n个影响因素, 同时收集交通事故的
持续时间, 得到交通事故持续时间集T=(t1, t2, ..., tk)T, tk为第k个样本的交通事故持续时
间;
S2、 数据清洗: 删除影响因素之间互相矛盾的样本数据和数据完整性小于预设百分比
的样本数据, 得到数据清洗后的样本集D ′=(d1′, d2′, ..., dp′)T和数据清洗后的交通事故
持续时间集T ′=(t1′, t2′, ..., tp′)T, di′为数据清洗后的第i个交通事故样本, tp′为数据清
洗后的第p个样本的交通事故持续时间;
S3、 变量分类赋值: 对步骤S2数据清洗后的样本集D ′、 数据清洗后的交通事故持续时间
集T′中的样本进 行分类离散处理并赋值, 得到 分类赋值后的样 本集D″和分类赋值后的事故
持续时间集T ″, 其中, D″=(d1″, d2″, ..., dp″)T, d″i为第i个分类赋值后的交通事故样本, d ″i
=(d(i1)′, d(i2)′, ..., d(in)′), d(in)′为第i个分类赋值后的交通事故样本的第n个影响因素; T ″
=(l1x, l2x, ..., lpx)T, x∈(1, 2, …, j), lix代表第i个分类赋值后的交通事故样本的事故持
续时间为第x个等级, 交通事故持续时间分类离 散为j类;
S4、 特征选择: 利用LASSO算法筛选与事故持续时间相关的变量, 利用链式方程多重插
补MICE填充缺失变 量, 得到完整样本集D(1)=(d1(1), d2(1), ..., dp(1))T, di(1)为第i个完整样本
集的交通事故样本;
步骤S4中LAS SO算法筛 选与事故持续时间相关的变量的具体方法为:
对于事故持续时间和影响因素有如下公式:
T″=D″β + ε
β 为回归系数, ε为随机误差;
Q( β )=|| ε||2=||T″ ‑D″β ||2
Q( β )为无偏估计量;
利用最小二乘法则有:
引入范数惩罚参数, 则有:
βLASSO为引入范 数惩罚参数的回归系数, βi为特征变量i的回归系数, η为第一调节系数;
λ为第二调节系数;
当η<Q(β )时, n个影响因素中部分因素的系数就会被压缩为0, 从而实现变量筛选, 剩
余的m个变量构成LASSO算法筛选后的样本集D ″ ′=(d1″ ′, d2″ ′, ..., dp″ ′)T, di″ ′为第i个
LASSO算法筛选后的交通事故样本, di″ ′=(d(i1)″, d(i2)″, ..., d(im)″), d(im)″为第i个LASSO算权 利 要 求 书 1/3 页
2
CN 115018213 B
2法筛选后的交通事故样本的第m个 影响因素;
步骤S4中利用链式方程多重插补MIC E填充缺失变量的具体方法为:
S4.1、 假设样本集D ″ ′中D″ ′1为完整的数据样本, D ″ ′2为部分影响因素值缺失的样本, 其
中, D″ ′1, D″ ′2∈D″ ′, MICE实现过程如下:
为D″ ′1中完整样本观测值,
为D″ ′2缺失样本中的缺失变量,
为β 后验分布中随机抽
取的值;
从完整样本D ″ ′1中选择样本
替换缺失样本D ″ ′2中的缺失变量
使得
最小
化, 进行填充缺失变量;
S4.2、 重复步骤S4.1填充全部 缺失变量, 得到完整样本集D(1)=(d1(1), d2(1), ..., dp(1))T,
di(1)=(di1(1), di2(1), dim(1)), dim(1)为第i个完整样本集的交通事故样本的第m个 影响因素;
S5、 模型构 建: 基于完整样本集D(1)构建事故持续时间预测模型: 首先构 建包含输入层、
两层隐藏层和输出层的前馈神经网络对数据集D(1)进行映射处理, 然后构建COX半参数模
型, 用于高速公路事故持续时间预测;
步骤S5中构建COX半参数模型的具体方法为:
S5.1、 将前馈神经网络的输出层的输出向量与第i个完整样本集的交通事故样本相结
合, 得到G, 作为COX半参数模型的输入条件:
G=[di1(1), di2(1), ..., dim(1), g]
G为前馈神经网络的输出 特征与LASSO输出的特 征集;
S5.2、 构建生存函数S(t), 计算t时刻, 事故对交通 流的影响仍在持续的概 率:
P为概率函数, h(u)为 风险函数, u为 风险函数变量, F(t)指事故持续时间的分布函数;
S5.3、 构建风险函数h(t), 衡量在t事故交通流还未恢复, 在 下一瞬间t +Δt交通流立刻
恢复的概 率:
其中f(t)为概率密度函数, 用于衡量某个随机变量在任意一个确实时间点附近取值的
可能性:
Δt→0, Tcon为交通事故 发生至交通 流恢复的持续时间, F ′(t)为F(t)的导数;
S5.4、 构建COX半参数模型:
为半参数模型,
为Cox模型估计的特征变 量系数, h0(t)为基准风险函 数, 指当权 利 要 求 书 2/3 页
3
CN 115018213 B
3
专利 高速公路事故持续时间预测方法、电子设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:41:25上传分享