专利名称: | 一种基于深度学习的车辆自动检测方法 | ||
专利名称(英文): | Automatic vehicle detection method based on deep learning | ||
专利号: | CN201510599194.6 | 申请时间: | 20150918 |
公开号: | CN105184271A | 公开时间: | 20151223 |
申请人: | 苏州派瑞雷尔智能科技有限公司; 青岛智能产业技术研究院; 江苏中科智能工程有限公司; 天问汇科(北京)技术有限公司 | ||
申请地址: | 215000 江苏省苏州市苏州工业园区林泉街399号2号楼410室 | ||
发明人: | 姚彦洁; 田滨; 王飞跃; 杨柳青 | ||
分类号: | G06K9/00; G06K9/62; G06K9/66 | 主分类号: | G06K9/00 |
代理机构: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
摘要: | 本发明提供了一种高清图像中基于深度学习的车辆自动检测方法,利用卷积神经网络自动提取交通环境中的车辆特征,最终实现车辆目标的自动检测和识别。本发明可用于不同环境、光照强度及天气情况,对于复杂交通环境中的车辆,可以保证较高的检测准确性,可为后续视频监控中车辆目标的识别与跟踪提供一种新的实时可靠的预处理步骤。 | ||
摘要(英文): | The invention provides an automatic vehicle detection method based on deep learning. The automatic vehicle detection method based on deep learning can utilize a convolution neural network to automatically extract the vehicle characteristics in the traffic environment so as to eventually realize automatic detection and identification of a vehicle target. The automatic vehicle detection method based on deep learning can be applied to different environments, different illumination intensities and different weather situations, and can guarantee higher accuracy for detection for a vehicle in a complicated traffic environment, and provides a new real-time reliable preprocessing step for identifying and tracking the vehicle target for the subsequent video monitoring. |
1.一种基于深度学习的车辆自动检测方法,其特征在于,包括: S1,采集真实交通视频,获得原始采样图像; S2,对所述原始采样图像进行候选区域提取,并将所述候选区域转化 为固定尺寸的图像; S3,利用卷积神经网络对所述固定尺寸的图像进行特征学习,并对学 习到的特征进行分类,得到深度学习模型; S4,利用所述深度学习模型对真实场景中的车辆进行自动检测。
2.根据权利要求1所述车辆自动检测的方法,其特征在于,所述步 骤S2包括: 对所述原始采样图像,利用训练后的二值正则梯度通用目标检测器, 快速生成多尺度的、可能包含车辆目标的候选区域,并从所述候选区域中 提取出多个目标子区域,根据所述目标子区域与车辆目标的重复部分的比 重,决定其为车辆样本或背景样本,通过图像归一化将所述目标子区域转 化为固定大小的图像。
3.根据权利要求1所述车辆自动检测的方法,其特征在于,所述卷 积神经网络包括1个输入层、4个卷积层、4个池化层、2个全连接层和1 个输出层,其整体结构为:输入层—卷积层—池化层—卷积层—池化层— 卷积层—卷积层—全连接层—全连接层—输出层,其中: 所述输入层用于将所述固定尺寸的图像输入至所述卷积神经网络; 所述卷积层用于采用多个卷积核得到图像特征; 所述池化层用于对所述图像特征进行均值池化操作,将所述图像特征 的数据量降维原来的四分之一; 所述全连接层用于连接当层神经元与前一层神经元; 所述输出层用于计算分类结果,根据结果得分判定候选目标是小汽车、 公交车或出租车。
4.根据权利要求3所述车辆自动检测的方法,其特征在于,所述卷 积层对输入图像进行二维卷积和偏置的操作后,再使用非线性激活函数, 获得一个卷积结果,即图像特征其表达式为:
5.根据权利要求4所述车辆自动检测的方法,其特征在于,输出层 通过softmax函数计算分类结果Ok:
6.根据权利要求5所述车辆自动检测的方法,其特征在于,在进行 特征学习时,采用梯度下降法调整所述卷积核的权重和偏置,并对池化层 的误差进行上采样操作。
1.一种基于深度学习的车辆自动检测方法,其特征在于,包括: S1,采集真实交通视频,获得原始采样图像; S2,对所述原始采样图像进行候选区域提取,并将所述候选区域转化 为固定尺寸的图像; S3,利用卷积神经网络对所述固定尺寸的图像进行特征学习,并对学 习到的特征进行分类,得到深度学习模型; S4,利用所述深度学习模型对真实场景中的车辆进行自动检测。
2.根据权利要求1所述车辆自动检测的方法,其特征在于,所述步 骤S2包括: 对所述原始采样图像,利用训练后的二值正则梯度通用目标检测器, 快速生成多尺度的、可能包含车辆目标的候选区域,并从所述候选区域中 提取出多个目标子区域,根据所述目标子区域与车辆目标的重复部分的比 重,决定其为车辆样本或背景样本,通过图像归一化将所述目标子区域转 化为固定大小的图像。
3.根据权利要求1所述车辆自动检测的方法,其特征在于,所述卷 积神经网络包括1个输入层、4个卷积层、4个池化层、2个全连接层和1 个输出层,其整体结构为:输入层—卷积层—池化层—卷积层—池化层— 卷积层—卷积层—全连接层—全连接层—输出层,其中: 所述输入层用于将所述固定尺寸的图像输入至所述卷积神经网络; 所述卷积层用于采用多个卷积核得到图像特征; 所述池化层用于对所述图像特征进行均值池化操作,将所述图像特征 的数据量降维原来的四分之一; 所述全连接层用于连接当层神经元与前一层神经元; 所述输出层用于计算分类结果,根据结果得分判定候选目标是小汽车、 公交车或出租车。
4.根据权利要求3所述车辆自动检测的方法,其特征在于,所述卷 积层对输入图像进行二维卷积和偏置的操作后,再使用非线性激活函数, 获得一个卷积结果,即图像特征其表达式为:
5.根据权利要求4所述车辆自动检测的方法,其特征在于,输出层 通过softmax函数计算分类结果Ok:
6.根据权利要求5所述车辆自动检测的方法,其特征在于,在进行 特征学习时,采用梯度下降法调整所述卷积核的权重和偏置,并对池化层 的误差进行上采样操作。
翻译:技术领域
本发明属于模式识别技术领域和交通监控系统技术领域,特别涉及一 种高清图像中基于深度学习的车辆自动检测的方法。
背景技术
目前我国城市化水平已经超过50%,汽车保有量达1.4亿辆,随之而 来的交通拥堵,环境污染,交通安全等问题日益突出。为解决现存交通系 统中人,车,路之间的矛盾,智能交通系统成为首选的理想方案。其中, 智能视频监控系统是智能交通系统中必不可少的部分。基于智能视频监控 系统的车辆检测,是利用模式识别技术对经过特定路段和路口的车辆进行 自动检测,获取车辆基本信息,如车牌,速度,车型等,为之后的车辆行 为分析,违章车辆图像抓拍,和违章取证等奠定基础。传统的智能监控系 统通常将车辆检测视为一个二分类问题来处理,无法自动判定车辆的类型 信息,而常见的车型识别方法也只是根据尺寸将车分为大型车、中型车, 和小型车,无法满足现代监控的需求。另外,当前的智能视频监控系统主 要通过人工提取车辆特征,如颜色特征、纹理特征,轮廓特征、几何特征 等,来识别车辆。手工标记车辆特征的方法耗时费力,且不能的充分利用 车辆信息,无法覆盖较多的行车环境,在遇到车辆遮挡,或车辆阴影时, 无法达到较高检测的准确性。
深度学习通过学习一种深层的非线性网络结构,实现复杂函数逼近和 输入数据表征,展现出强大的数据集本质特征的学习能力。卷积神经网络, 作为一种典型的深度学习方法,是为二维图像处理而特别设计的一个多层 感知器。卷积神经网络不需要人为参与特征的选取过程,可以自动地学习 大量数据集中的目标特征。其权值共享和局部连接机制使得它具备优于传 统技术的优点:对几何变换、形变、光照具有一定程度的不变性,同时具 有良好的容错能力、并行处理能力和自学习能力。这些优点使得卷积神经 网络在处理环境信息复制,推理规则不明确情况下的问题时具有较大优势, 并能容忍车辆的尺度变化,旋转变形等问题。因此,卷积神经网络可以用 于解决智能视频监控系统中车辆的自动检测和车型识别,保证智能监控系 统准确地、稳定地获取车辆信息。
发明内容
(一)要解决的技术问题
本发明的目的在于,提供一种基于深度学习的车辆自动检测方法,可 以自动学习车辆特征,实现更高精度的车辆自动检测,和车辆类型识别。
(二)技术方案
本发明提供一种基于深度学习的车辆自动检测的方法,包括:
S1,采集真实交通视频,获得原始采样图像;
S2,对原始采样图像进行候选区域提取,并将候选区域转化为固定尺 寸的图像;
S3,利用卷积神经网络对固定尺寸的图像进行特征学习,并对学习到 的特征进行分类,得到深度学习模型;
S4,利用深度学习模型对真实场景中的车辆进行自动检测,并自动识 别车辆类型(小汽车/出租车/公交车)。
(三)有益效果
本发明具以下优点:
(1)可以自动逐层抽象出输入卷积神经网络的图像特征,减少人为 标记特征的工作量,节约人工成本和时间成本;
(2)快速实现车辆目标定位,并能识别出车辆类型(小汽车/出租车/ 公交车);
(3)对不同环境,光照强度,和天气情况,均具有良好的适应性;
(4)对大流量车辆的拥挤环境,可以在一定程度上处理遮挡问题, 保证较高的检测准确率。
附图说明
图1是本发明实施例提供的基于深度学习的车辆自动检测方法的流程 图。
图2是本发明实施例中训练样本的典型图像。
图3是本实施例中最终检测结果的示意图。
具体实施方式
本发明提供一种高清图像中基于深度学习的车辆自动检测方法,利用 卷积神经网络自动提取交通环境中的车辆特征,最终实现车辆目标的自动 检测。本发明可用于不同环境、光照强度及天气情况,对于复杂交通环境 中的车辆,可以保证较高的检测准确性,可为后续视频监控中车辆目标的 识别与跟踪提供一种新的实时可靠的预处理步骤。
根据本发明的一种实施方式,车辆自动检测方法包括:
S1,采集真实交通视频,获得原始采样图像;
S2,对原始采样图像进行候选区域提取,并将候选区域转化为固定尺 寸的图像;
S3,利用卷积神经网络对固定尺寸的图像进行特征学习,并对学习到 的特征进行分类,得到深度学习模型;
S4,利用深度学习模型对真实场景中的车辆进行自动检测。
根据本发明的一种实施方式,步骤S2包括:
对原始采样图像,利用训练后的二值正则梯度(BING:Binarized NormedGradients)通用目标检测器,快速生成多尺度的、可能包含车辆 目标的候选区域,并从候选区域中提取出多个目标子区域,根据目标子区 域与车辆目标的重复部分的比重,决定其为车辆样本或背景样本,通过图 像归一化将目标子区域转化为固定大小的图像,优选地,图像大小可选为 32×32像素。
根据本发明的一种实施方式,卷积神经网络包括1个输入层、4个卷 积层、4个池化层、2个全连接层和1个输出层,其整体结构为:输入层 —卷积层—池化层—卷积层—池化层—卷积层—卷积层—全连接层—全 连接层—输出层,其中:
输入层用于将所述固定尺寸的图像输入至所述卷积神经网络;
卷积层用于采用多个卷积核得到图像特征;
池化层用于对所述图像特征进行均值池化操作,将所述图像特征的数 据量降维原来的四分之一;
全连接层用于连接当层神经元与前一层神经元;
输出层用于计算分类结果。
根据本发明的一种实施方式,卷积层对输入图像进行二维卷积和偏置 的操作后,再使用非线性激活函数,获得一个卷积结果,即图像特征其表达式为:
其中,n代表网络层数,U代表第n层的神经元个数,wij表示第i个 输入图像和第j个输出图像的卷积权重,bj代表第j个输出图像的偏置,f(·) 为神经元激活函数,f(x)=max(0,x)。
根据本发明的一种实施方式,输出层通过softmax函数计算分类结果:
其中,k代表输出层的类别数,M为最后一个全连接层的神经元数目, N代表网络的总层数,f(·)为softmax函数,
根据本发明的一种实施方式,在进行特征学习时,采用梯度下降法调 整所述卷积核的权重和偏置,并对池化层的误差进行上采样操作。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实 施例,并参照附图,对本发明进一步详细说明。
图1是本发明实施例提供的基于深度学习的车辆自动检测方法的流程 图,如图1所示,方法包括:
S1,利用高清相机采集真实交通视频,获得原始采样图像;
本发明实例中,相机以一定高度和角度对车辆流进行拍摄,尽量模拟 真实的交通监控系统的视角,获取尽可能多的交通图像样本。
S2,对原始采样图像进行候选区域提取,并将候选区域转化为固定尺 寸的图像,作为卷积神经网络的输入。
首先,利用训练后的二值正则梯度检测器生成可能的目标区域,从原 始图像中提取出1500个不同大小的目标子区域,给出可能的目标位置。 根据子区域与车辆目标的重复部分的比重,决定其是车辆样本还是背景样 本。本实施例中,比重阈值选取为0.3,可以保证检测到部分遮挡的车辆。
然后,将获取的目标子区域转化为固定大小的图像,即图像的归一化, 这里为32×32像素大小,作为后续卷积神经网络的输入。
图2为正样本的典型图像,包括公交车,小汽车,和出租车。其中, 二值正则梯度的训练分两个步骤:1)提取正负样本64维的二值正则梯度 特征,训练线性SVM分类器;2)对上步训练的分类器的结果,进行非极 大值抑制,得到最终的输出。
S3,利用卷积神经网络对固定尺寸的图像进行特征学习,并利用 softmax分类器对卷积神经网络学习到的特征进行分类,得到深度学习模 型;
本发明实例构建的卷积神经网络模型采用10层网络结构,包括输入 层,4个卷积层,4个池化层,2个全连接层,和输出层。整体结构为:输 入层—卷积层—池化层—卷积层—池化层—卷积层—卷积层—全连接层 —全连接层—输出层。
输入层将32×32像素大小的子图像输入卷积神经网络。
卷积层的作用是提取图像特征。对输入图像进行二维卷积和偏置的操 作后,再使用非线性激活函数,便可获得一个卷积结果,即获得一个图像 特征
其中,n代表网络层数,U代表第n层的神经元个数,wij表示第i个 输入图像和第j个输出图像的卷积权重,wj代表第j个输出图像的偏置,f(·) 为神经元激活函数,f(x)=max(0,x)。并且,前3个卷积核的大小为5×5, 最后1个卷积核的大小为3×3,各层卷积核的滑动步长为1。
池化层的作用是特征统计和数据降维,沿图像行和列的方向上,每两 个像素进行统计,抽取四个像素的均值(mean)作为该区域的统计特征, 同时将数据量降维原来的四分之一。
全连接层是当层的神经元与前一次神经元全部连接,之后,输出层通 过softmax函数计算分类结果Ok:
其中,k代表输出层的类别数,M为最后一个全连接层的神经元数目, N代表网络的总层数,f(·)为softmax函数,
反向传播阶段,采用梯度下降法调整卷积神经网络各层的卷积核的权 重和偏置。输出层的误差函数为,
卷积层的梯度:其中
对偏置b:
对卷积核权重k:这里,与逐 元素相乘的patch结果。
下采样层梯度:其中,conv(·)是卷积操 作。
对偏置b:
当误差E<ε时,其中,ε为预先设置的最小误差阈值,训练结束,并 保存各层的权重和阈值。
最后,对训练好的网络进行微调,就可完成所述卷积神经网络模型的 训练。注意,上述模型把检测问题转化成一个二分类问题,即车辆和背景。
S4,利用深度学习模型对真实场景中的车辆进行自动检测和识别。图 3是本方法最终检测结果的示意图,其中,矩形框分别标出了出租车、小 汽车和公交车。
训练好模型后,就可将模型用于真实场景中的车辆进行自动检测,由 于训练输入时包含了部分旋转和部分车辆的图像,所以此模型对旋转,部 分遮挡有一定的容忍性。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行 了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而 已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修 改、等同替换、改进等,均应包含在本发明的保护范围之内。