专利一种用于辅助驾驶的视线检测方法、装置及存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111436975.5 (22)申请日 2021.11.29 (71)申请人北京茵沃汽车科技有限公司地址 100191 北京市海淀区西小口路6 6号7 幢二层21 1B室 (72)发明人刘春霞　路二伟　杨波　张会朋　侯欢欢　 (74)专利代理机构苏州国诚专利代理有限公司 32293 代理人陈松 (51)Int.Cl. G06V 40/18(2022.01) G06N 5/04(2006.01) G06F 30/27(2020.01) (54)发明名称一种用于辅助驾驶的视线检测方法、装置及存储介质 (57)摘要本发明提供了一种用于辅助驾驶的视线检测方法、装置及存储介质，其可以获取可靠的视线数据，计算操作方便，提升了视线检测的准确率，计算复杂度较低,其通过相机采集数据，使得被采集人员的视线跟随目标物体移动，获得人眼跟随目标物体移动的图像，计算视线方向数据；构建包括眼球模型推理模块和视线回归模块的视线检测模型，将图像输入眼球模型推理模块输出眼球二值图，将眼球二值图输入视线回归模块，输出推理的视线方向；由采集的人眼随目标物体移动的图像和视线方向数据构建视线数据集，通过视线数据集训练视线检测模型，获得训练好的视线检测模型；将采集的待检测的人眼图像输入训练好的视线检测模型，输出待检测的人眼的视线方向。权利要求书3页说明书8页附图3页 CN 114067422 A 2022.02.18 CN 114067422 A 1.一种用于辅助驾驶的视线检测方法，其特征在于，包括以下步骤：通过相机采集数据，使得被采集人员的视线跟随目标物体移动，获得人眼跟随目标物体移动的图像；根据获得的人眼跟随目标物体移动的图像，计算视线方向数据；构建视线检测模型，所述视线检测模型包括眼球模型推理模块和视线回归模块，将图像输入眼球模型推理模块，输出眼球二值图，所述眼球二值图包括眼球轮廓和瞳孔轮廓，将眼球二值图输入视线回归模块，输出推理的视线方向；由采集的人眼随目标物体移动的图像和计算得到的视线方向数据构建视线数据集，通过视线数据集训练所述视线检测模型，直至模型收敛，获得训练好的视线检测模型；将采集的待检测的人眼的图像输入训练好的视线检测模型，输出待检测的人眼的视线方向。 2.根据权利要求1所述的一种用于辅助驾驶的视线检测方法，其特征在于，所述的通过相机采集数据，包括：将红外相机和深度相机放置在同一水平面内，在被采集人员面前摆放目标物体，移动目标物体，被采集人员通过人眼观察目标物体，视线跟随目标物体移动，通过红外相机和深度相机同步采集图像，使得目标物体移动的轨迹铺满图像的整个区域。 3.根据权利要求2所述的一种用于辅助驾驶的视线检测方法，其特征在于，所述的被采集人员通过人眼观察目标物体，包括：被采集人员的头部姿势，维持面部朝向一个方向不变，移动目标物体，被采集人员通过人眼观察目标物体，视线跟随目标物体移动，通过红外相机和深度相机采集图像，使得目标物体移动的轨迹铺满图像的整个区域。 4.根据权利要求2所述的一种用于辅助驾驶的视线检测方法，其特征在于，所述的被采集人员通过人眼观察目标物体，包括：被采集人员的视线跟随目标物体移动，被采集人员的头部与视线的方向一致，随目标物体一起移动，通过红外相机和深度相机采集图像，使得目标物体移动的轨迹铺满图像的整个区域。 5.根据权利要求3或4所述的一种用于辅助驾驶的视线检测方法，其特征在于，通过红外相机和深度相机采集图像中，至少包括左上方、上方、右上方、左方、前方、右方、左下方、下方和右下方的面部朝向的图像。 6.根据权利要求1所述的一种用于辅助驾驶的视线检测方法，其特征在于，所述的根据获得的人眼随目标物体移动的图像，计算视线方向数据，包括：获取人眼的瞳孔中心在深度相机坐标系下的坐标，通过深度相机和红外相机的坐标系转换关系，得到瞳孔中心在红外相机坐标系下的坐标，获取目标物体在深度相机坐标系下的坐标，通过深度相机和红外相机的坐标系转换关系，得到目标物体在红外相机坐标系下的坐标，将瞳孔中心坐标减去目标物体坐标，获视线向量，用于表示视线方向。 7.根据权利要求1所述的一种用于辅助驾驶的视线检测方法，其特征在于：所述目标物体采用球形物体。 8.根据权利要求6所述的一种用于辅助驾驶的视线检测方法，其特征在于，所述的获取人眼的瞳孔中心在深度相机坐标系下的坐标，包括：通过深度相机的拍摄获得瞳孔的深度信息Zc，通过图像标注，获得瞳孔中心在图像坐标系的坐标(u， v)，根据图像坐标与深度相机坐标的转换公式：权　利　要　求　书 1/3 页 2 CN 114067422 A 2其中，的深度相机的内参矩阵，获得瞳孔中心在深度相机坐标系下的坐标 (Xc， Yc， Zc)。 9.根据权利要求6所述的一种用于辅助驾驶的视线检测方法，其特征在于，所述的深度相机和红外相机的坐标系转换关系，通过如下步骤得到：对红外相机和深度相机进行双目标定，得到平移矩阵T和旋转矩阵R，同一个坐标点在深度相机坐标系下和红外相机坐标系下的转换关系，表示为P1＝R*P2+T，其中， P1是红外相机坐标系下的坐标点， P2是深度相机坐标系下的坐标点。 10.根据权利要求6所述的一种用于辅助驾驶的视线检测方法，其特征在于：所述眼球模型推理模块包括直方图均衡化层和ResNet网络层以及一个1*1卷积过滤器，所述直方图均衡化层用于增加输入的图像的对比度，所述ResNet网络层包括三个ResNet网络，用于提取人眼特征，所述1*1卷积过滤器用于将提取的特征转换为眼球二值图；所述视线回归模块包括DenseNet网络层和全连接层，所述DenseNet网络层包括三个残差模块，所述视线回归模块通过输入的眼球二值图，得到眼球中心和瞳孔中心的连接线，作为视线方向输出。 11.根据权利要求1所述的一种用于辅助驾驶的视线检测方法，其特征在于：所述的通过视线数据集训练所述视线检测模型，包括：将视线数据集中的图像作为样本，将视线数据作为标签，输入视线检测模型的眼球模型推理模块，输出推理的眼球二值图，优化损失函数，表示为如下：其中，是常数， p表示每个像素的坐标， P表示整个图像的像素坐标，表示眼球模型预测出来的眼球二值图， m(p)表示图像的眼球二值图；将推理的眼球二值图输入视线检测模型的视线回归模块，输出推理的视线方向，将推理的视线方向与真实的视线方向进行比较，优化损失函数，表示为如下：其中， w和 ε是常数， glabel是估计的视线方向， g是视线检测模型推理的视线方向， l n()是对数。 12.一种用于辅助驾驶的视线检测方法的装置，其特征在于，其包括：包括处理器、存储器以及程序；所述程序存储在所述存储器中，所述处理器调用存储器存储的程序，以执行权利要求1 至权利要求1 1任意项所述的用于辅助驾驶的视线检测方法。权　利　要　求　书 2/3 页 3 CN 114067422 A 3

专利 一种用于辅助驾驶的视线检测方法、装置及存储介质

专利一种用于辅助驾驶的视线检测方法、装置及存储介质