专利 基于BN-CNN的高速可见光定位图像处理方法、系统及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210654874.3 (22)申请日 2022.06.10 (71)申请人暨南大学地址 510632 广东省广州市天河区黄埔大道西601号 (72)发明人方俊彬　李丹婕　林嘉俊　魏展航　江灿健　陈姝豫　蒋琳　 (74)专利代理机构广州市华学知识产权代理有限公司 4 4245 专利代理师李斌 (51)Int.Cl. G06T 7/73(2017.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于BN-CNN的高速可见光定位图像处理方法、系统及介质 (57)摘要本发明公开了一种基于BN ‑CNN的高速可见光定位图像处理方法、系统及介质，方法为：获取信号发射端 LED灯的唯一标识符并编码为交叉二五码，通过调制器使用开关键控对LED灯进行调制，驱动LED灯发出不同频率的光信号；使用CMOS 图像传感器在信号接收端捕获光信号图像，并划分为训练集和测试集；将条纹图像训练集导入设计好的批规范化卷积神经网络进行训练，使用连续梯度下降法优化损失，获得条纹图像分类模型；将条纹图像测试集导入条纹图像分类模型进行识别，判断条纹图像所属类别及类别对应LED 灯的唯一标识符，确定信号接收端的位置。本发明通过批规范化卷积神经网络来进行深度学习，提高了高速运动下捕捉到的模糊图像的识别速度和准确率，具有良好的鲁棒性。权利要求书3页说明书9页附图5页 CN 115100279 A 2022.09.23 CN 115100279 A 1.基于BN ‑CNN的高速可见光定位图像处理方法，其特征在于，包括下述步骤：获取信号发射端LED灯的唯一标识符并编码为交叉二五码，再通过调制器使用开关键控对LED灯进行调制，驱动LED灯发出不同频率的光信号；使用CMOS图像传感器在信号接收端捕获不同LED灯发出的光信号图像，并划分获得条纹图像训练集和条纹图像测试集；将条纹图像训练集导入设计好的批规范化卷积神经网络进行训练，使用连续梯度下降法优化损失，获得条纹图像分类模型；将条纹图像测试集导入条纹图像分类模型进行识别，判断条纹图像所属类别及类别对应LED灯的唯一标识符，确定信号接收端的位置。 2.根据权利要求1所述的基于BN ‑CNN的高速可见光定位图像处理方法，其特征在于，所述获得条纹图像训练集和条纹图像测试集，具体为：使用CMOS图像传感器在不同移动速度状态下从不同角度对多个LED灯的光信号进行捕获，并将捕获到的条纹图像保存，同时记录条纹图像对应的LED灯唯一标识符UID、拍摄时的移动速度以及拍摄角度作为标签值；对拍摄得到的条纹图像进行图像预处理：将条纹图像转换为灰度图像；通过检验行列像素和的方法，设置阈值，确定完整条纹图像的行列边界，向外延伸边界进行裁剪得到完整条纹图像；将预处理后的条纹图像进行随机划分，获得条纹图像训练集和条纹图像测试集。 3.根据权利要求1所述的基于BN ‑CNN的高速可见光定位图像处理方法，其特征在于，所述设计好的批规范化卷积神经网络BN ‑CNN包括输入层、 Conv1层、 Conv2层、 M1层、 FC1层、 M2 层、 FC2层及输出层；所述Conv1层包括卷积层、批规范化层、 ReLU激活层及最大池化层，用于提取特征获取特征图；所述Conv2层包括卷积层、批规范化层、 ReLU激活层及最大池化层，用于提取高维特征获得高维特征图；所述M1层包括dropout层及flatten层，用于将高维特征图转换为特征数组；所述FC1层包括全连接层、批规范化层及ReLU激活层，用于加入非线性因素；所述M2层包括dropout层，用于降低神经网络神经元之间的共适应关系；所述FC2层包括全连接层和批规范化层，用于输出分类结果；所述输出层包括Softmax分类器，用于计算分类结果对应的概率分布，输出概率最大的分类信息。 4.根据权利要求3所述的基于BN ‑CNN的高速可见光定位图像处理方法，其特征在于，所述Conv1层中的卷积层使用32个3 ×3大小的卷积核且步长为(1,1对输入层输入的条纹图像训练集进行特征提取，生成32个特征图，卷积层进行特征映射获取特征图的公式为：其中， Xi为条纹图像训练集中第i张条纹图像， Yi为第i张条纹图像对应的特征图， bi为神经元的偏置， wji为神经元的权值， *为卷积运算；权　利　要　求　书 1/3 页 2 CN 115100279 A 2使用零填充方式填充特征图的边缘像素，得到 32个800×800大小的特征图；利用批规范化层对卷积层填充后的特征图进行规范化，将特征图的平均值和方差限制在[0,1]的范围内；利用ReLU激活层的激励函数，将批规范化层的输出非线性映射到Conv1层中的最大池化层；最大池化层使用步长为(2,2)的最大池化，计算并输出轮询窗口滑动过程所对应的数据最大值，输出大小为400×400像素的特征图。 5.根据权利要求4所述的基于BN ‑CNN的高速可见光定位图像处理方法，其特征在于，所述Conv2层中的卷积层使用64个3 ×3大小的卷积核对Conv1层获取32个400 ×400像素大小的特征图进行高维特征提取，生成64个高维特征图；再将高维特征图经过Conv2层中批规范化层、 ReLU激活层和最大池化层，输出64个大小为200×200像素的高维特征图。 6.根据权利要求5所述的基于BN ‑CNN的高速可见光定位图像处理方法，其特征在于，所述M1层中的dropout层在正向传播过程中随机丢弃50％的隐藏神经元；所述M1层中的 flatten层将Conv2层输出的64个200 ×200像素大小的高维特征图转变为64个200 ×200的一维特征数组；所述FC1层中的全连接层使用512个连接节点将输入的一维特征数组转换为512个特征值，输出到FC1层中的批规范化层；所述FC1层中的批规范化层将特征值调整为标准正态分布，输出值输入FC1层中的ReLU激活层，加入非线性因素；所述FC2层的最后一层连接点数为N的全连接层输出N个分类结果，对应N个唯一标识符。 7.根据权利要求6所述的基于BN ‑CNN的高速可见光定位图像处理方法，其特征在于，所述输出层使用Softmax分类器将FC2层输出的N个分类结果转化为加起来为1的分类百分比，转化公式为：其中， Vi为输出层输入的第i个分类结果；分析分类百分比，输出概率最大的分类所对应的唯一标识符UID；利用Softmax分类器输出的概率分布和损失函数计算BN ‑CNN的损失值 Li，损失函数为： Li＝‑logP(Y＝ti|X＝xi) 使用连续梯度下降法对卷积层的卷积核进行反向传播优化，使损失值Li不断减小，得到条纹图像分类模型。 8.根据权利要求7所述的基于BN ‑CNN的高速可见光定位图像处理方法，其特征在于，所述确定信号接收端的位置，具体为：将条纹图像测试集导入条纹图像分类模型中进行识别，解码获得LED灯对应的唯一标识符UID；查找“UID‑坐标”映射表来检索UID对应LED灯的空间坐标；若图像分类模型输出为一个LED灯的唯一标识符，则根据检索的对应LED灯的空间坐标确定信号接收端的位置；权　利　要　求　书 2/3 页 3 CN 115100279 A 3

专利 基于BN-CNN的高速可见光定位图像处理方法、系统及介质

专利基于BN-CNN的高速可见光定位图像处理方法、系统及介质