摘要
合成孔径雷达(SAR)具有不受云层干扰、可全天时、全天候对地观测的特点,基于SAR图像的舰船检测已广泛用于海洋搜救、港口侦察、领海防御等民用或军用领域。然而,与大型舰船相比,像素点少、对比度低的小型舰船存在漏检率高的问题,并且速度和精度之间的平衡成为舰船检测算法天基应用的难点。针对以上问题,本文提出了一种基于YOLOv5s模型改进的舰船检测轻量化模型(ImShips)。首先,针对船体大小差异导致的漏检问题,采取在网络底部使用感受野较小的标准卷积,提升了模型对小规模舰船空间信息的获取能力。同时,在网络顶部设计了放大感受野的扩张卷积,保留了更多的语义特征,有利于大目标的特征提取。接着,提出将轻量级的通道注意力机制应用于YOLOv5的骨干网络和特征融合网络,通过对提取到的特征按重要性分配权重,实现纹理信息的筛选。最后,在下采样时采取深度可分离卷积代替标准卷积,减少了模型参数的数量,进一步提高了模型的推理速度。实验结果表明,在SAR舰船检测SSDD和ISSID数据集中,改进后的ImShips模型在保证精度的同时,所需的浮点计算数比YOLOv5s模型减少了45.61%,检测速度提高了8.31%。ImShips模型网络规模小、检测速度快,在实时天基舰船检测中具有较大的应用潜力。
随着空间遥感技术的飞速发展,从星载传感器获取的高分辨率和大规模遥感图像不断丰富,促进了遥感图像广泛的应用,例如自然灾害评估,城市规划,交通管理,环境监测,和海上目标的探测和识别。其中,舰船检测在民用领域,例如航行安全、渔业管理、船舶救助、海洋监测等,和军事领域,例如国防建设、航行安全、港口监视等具有重要价值,遥感图像中的自动舰船检测已经引起了越来越多的兴趣。
舰船检测包括船体检测和尾流检测。在某些卫星图像中,尾迹比船体更明显。但是,当舰船停泊在港口,或者船只尾迹被云遮挡时,尾迹并非一直存在,因此船体检测应用场景更广。早在2002欧盟海洋变换空间的检测与分类(Detection and Classification of Marine Transform Space, DECLIMS)和法国研究与发展研究所(Institute for Research and Development, IRD)合作利用光学图像进行舰船目标检测,自此,基于卫星图像的舰船目标检测和分类应用系统开始出现。现有船体目标检测技术主要依赖于可见光、红外和合成孔径雷达(SAR)成像技术。其中,可见光拥有高图像分辨率,在遥感舰船检测方面有丰富的研究成果,但可见光成像基于光线的反射,在光照不足情况下,难以看清并识别目标,在全天候检测能力方面存在不足。红外热成像通过接收目标本身和背景之间的红外辐射差而工作,被动接收辐射,隐蔽性好,安全性更强。但是红外热成像的数据集较少,且分辨率低。合成孔径雷达可以在不同的光照条件和天气下全天时、全天候工作,探测距离远,可远距离作业去提供高分辨率图像。由于光学图像和 SAR 图像的成像机制不同,基于SAR图像的舰船检测易受海浪、岛屿、陆地等回波、射频及大气噪声等海面杂波虚警干扰。
传统的基于先验知识的SAR舰船检测方法首先采用二值化、阈值分割或形态学等方法分割目标与背景区域,接着提取与识别几何和纹理特征。在船只目标几何特征明显的场景下,基于几何特征例如:面积、长宽比、紧凑度、船头形状等的分割方法效果很好。但当舰船被云雾遮挡或靠岸时,基于几何特征的分割方法并不适用,需要加入纹理特征。利用统计、几何方法、模型法和信号处理法等提取能量、惯量、熵、相关性等纹理特征,可以表达图像整体特征,具有旋转不变性以及抗干扰能力。但是,纹理特征受分辨率影响大,不同分辨率情况下,纹理特征偏差大。基于经典算子的方法主要包括目标候选区域提取和目标精细判别两部分,需要手工设计特征并分类。候选区域提取的方法通过使用描述纹理的局部二进制模式,描述特征的方向梯度直方图(Histogram of Oriented Gradients, HOG)、尺度不变特征变换(Scale-Invariant Feature Transform, SIFT)或角点提取(Harris)等手动提取特征,以降低背景对检测的干扰。接着使用支持向量机、极端学习机、K最邻近法、线性判别分析或自适应增强等算法对目标精细分类。上述传统算法针对简单场景下的目标背景分割取得了成功。但是,由于其手工特征的建立过分依赖专家经验,因此其泛化能力较弱,当舰船处于复杂的天气条件下时会遇到瓶颈。
自2014年深度学习技术火热发展,目标检测算法也从基于手工特征的传统方法转向了基于深度神经网络的检测技术,深度学习凭借强大的自动提取特征能力被广泛应用于SAR影像中的舰船检测。Zou等
You Only Look Once (YOLO)系列是经典的一阶段目标检测算法,将图像划分为网格系统的端到端的目标检测算法,可将目标检测问题转化为回归问题。Wang等
基于YOLO系列的目标检测算法可分为基于锚(Anchor based)、无锚(Anchor free)和两者融合类。基于Anchor based检测算法会在特征图上密集生成大量的锚框,在特征图中每个节点存储的是以该节点为中心的数个子图的特征,根据节点周围预设的子图的特征计算分类,该方法适用于密集目标的检测。而Anchor free 检测算法通过在图片中检测关键点的方法来设定锚框,根据锚框网格特征计算分类,大大减少了计算量。考虑到检测实时性的要求,我们的模型基于Anchor free的YOLOv5算法。
当SAR图像中舰船实际尺寸较小时,仅将舰船显示一个亮点,导致像素点少、对比度低的小型舰船存在漏检率高的问题。并且速度和精度之间的平衡成为舰船检测算法天基应用的难点。为了获得更高的检测精度和更快的识别速度,本文提出了一种改进的SAR舰船检测模型(ImShips)。针对船体大小差异导致的漏检问题,使用了不同大小感受野的扩张卷积(Dilated Conv)和轻量化的通道注意力机制(SElayer)去筛选更重要的舰船特征。为了满足星载实时性检测的要求,结合了深度可分离卷积(DWConv)对模型进行压缩,大大减少了模型复杂度与推测时间。
由卷积神经网络的性能优良的驱动,基于深度学习的检测模型已经成为解决舰船检测问题的新方法。根据是否生成提议区域进行分类,基于深度学习的检测方法可以大致分为:一阶段和两阶段的检测方法。两阶段的经典检测方法包括:R-CN
YOLO系列模型在深度学习目标检测领域的准确率和速度综合表现最好。YOLOv5在YOLOv

图1 轻量化回归模型ImShips
Fig. 1 Lightweight regression ImShips model
池化操作增大了感受野但是降低了分辨率,导致检测精度低。而扩张卷
我们的骨干网络由各种膨胀率的卷积层的几个分支组成,有利于提取具有大纵横比的舰船特征并通过其全局依赖性增强局部特征。骨干网络底部感受野小,可以保留更多的图像细节,有利于小目标的特征提取。网络顶部感受野大,保留了较多的语义特征,有利于大目标的特征提取,有效提高了ImShips模型对不同尺度舰船的特征提取效果。
, | (1) |
, | (2) |
. | (3) |
如

图2 SElayer模块
Fig. 2 SElayer module
软注意机
, | (4) |
, | (5) |
,,, | (6) |
. | (7) |
为了应对地面基站数量、存储空间和计算资源有限,平衡星载舰船检测的精度和速度,我们提出了一种基于轻量级回归算法的星载图像舰船检测的框架。基于MobileNet网
. | (8) |

图3 DWConv模块
Fig. 3 DWConv module
该实验采用了公开的SAR图像舰船目标检测数据集(SAR Ship Detection Dataset, SSD
准确率(Pr.)和召回率(Re.)是模型性能两个不同维度的度量,所需的混淆矩阵如
其中,(True Positive)为真阳性,(True Negative)为真阴性,(False Positive)为假阳性,(False Negative)为假阴性。为卷积核大小,为输出通道数,为分组卷积组数,为输出数据点。
, | (9) |
, | (10) |
, | (11) |
, | (12) |
. | (13) |
我们的实验基于台式计算机,使用NVIDIA- smi 470.57.02,驱动版本为470.57.02,CUDA版本为11.4,NVIDIA RTX 3070 GPU,Pytorch框架。我们利用SGD优化器来更新网络权重。网络的初始学习率设置为前100次迭代的0.01,后100次迭代的0.001。优化器的重量衰减为0.001,动量为0.98。
如
我们的模型和YOLOv5s模型表现出了针对SAR图像舰船检测的优越性。与YOLOv5s相比,ImShips模型的准确率提高了0.65%,召回率提高了1.05%,AP提高了1.25%,所需的浮点计算数减少了45.61%,推断时间减少了8.31%,平均推断时间检测的图片大小大约为400×300,如
如

图4 针对简单背景:(a)大片海域,和针对复杂背景:(b-g)靠岸区域,(h)河道,(i,j)港口,(k)多尺度船体大小的SAR图像回归预测结果
Fig. 4 Regression prediction results of SAR images with simple background: (a) wide sea, and complex background: (b-g) shoreside, (h) river channel, (i, j)port, (k) different hull sizes
实验结果表明,我们的模型针对SAR舰船检测SSDD和ISSID数据集具有优越性,改进后的ImShips模型在比YOLOv5s模型的权重数减少了45.61%,检测速度提高了8.31%,平均精准度提高了1.25%。ImShips模型网络规模更小,实时性更好,有效提高了海面物体检测任务的速度和准确度。通过大量文献调研,我们对星载SAR舰船探测所面临的挑战做了以下总结:1)陆海分割不正确,在陆海交界处容易产生过多的误报。2)SAR图像中复杂的背景,例如噪声,云层和礁石等,很容易干扰大小不同的舰船目标。3)船只的外观和大小各异,小型船只难以被准确地定位和检测。4)在资源有限的星载实时应用中,算法的检测性能和计算复杂度难以平衡硬件资源的存储空间。5)数据集较少,标注工作量巨大,尤其是被旋转边框标注的图像。由此,我们接下来的工作将会着重于制作旋转框数据集,或者标注所需工作量更大的语义分割数据集,并合理部署轻量化模型到硬件平台。
References
Zou L, Zhang H, Wang C, et al. MW-ACGAN: Generating Multiscale High-Resolution SAR Images for Ship Detection[J]. Sensors, 2020, 20, 6673. 10.3390/s20226673 [百度学术]
Redmon Joseph, Farhadi Ali. YOLOv3: An Incremental Improvement[C]. Computer Vision and Pattern Recognition, April 2018. 10.1109/cvpr.2018.00430 [百度学术]
Chen P, Li Y, Zhou H, et al. Detection of Small Ship Objects Using Anchor Boxes Cluster and Feature Pyramid Network Model for SAR Imagery[J]. Mar. Sci. Eng. 2020, 8, 112. 10.3390/jmse8020112 [百度学术]
Lin T, Dollár P, Girshick R, et al. Feature Pyramid Networks for Object Detection[C]. Computer Vision and Pattern Recognition, 2017, . 936-944. 10.1109/cvpr.2017.106 [百度学术]
Wang Jingpu, Lin Youquan, Guo Jie, et al. SSS-YOLO: towards more accurate detection for small ships in SAR image[J], Remote Sensing Letters, 2021, 12:2,93-102 [百度学术]
Zhao Y, Zhao L, Xiong B, et al. Attention Receptive Pyramid Network for Ship Detection in SAR Images[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2020, 13 2738-2756. 10.1109/JSTARS.2020.2997081 [百度学术]
Tang G, Zhuge Y, Claramunt C, et al. N-YOLO: A SAR Ship Detection Using Noise-Classifying and Complete-Target Extraction[J]. Remote Sens. 2021, 13, 871,. 10.3390/rs13050871 [百度学术]
Girshick R, Donahue J, Darrell T, et al. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C]. Computer Vision and Pattern Recognition, 2014, 580-587. 10.1109/cvpr.2014.81 [百度学术]
Girshick R. Fast R-CNN[C]. IEEE International Conference on Computer Vision (ICCV), 2015, 1440-1448. 10.1109/iccv.2015.169 [百度学术]
Ren S, He K, Girshick R, et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6)1137-1149. 10.1109/TPAMI.2016.2577031 [百度学术]
Liu W, Anguelov D, Erhan D, et al. SSD: Single Shot MultiBox Detector[C]. Computer Vision (ECCV) Lecture Notes in Computer Science, 2016,. 9905,. 10.1007/978-3-319-46448-0_2 [百度学术]
Lin T, Goyal P, Girshick R, et al. Focal Loss for Dense Object Detection[C]. IEEE International Conference on Computer Vision (ICCV), 2017, 2999-3007,. 10.1109/iccv.2017.324 [百度学术]
Bochkovskiy A, Wang C, Liao H. YOLOv4: Optimal Speed and Accuracy of Object Detection[C]. Computer Vision and Pattern Recognition, 2020,. 10.1109/cvpr46437.2021.01283 [百度学术]
Tan Mingxing, Pang Ruoming, Quoc V. Le. EfficientDet: Scalable and Efficient Object Detection[C]. Computer Vision and Pattern Recognition, 27 Jul 2020. [百度学术]
Han K, Wang Y, Tian Q, et al. GhostNet: More Features From Cheap Operations[C]. Computer Vision and Pattern Recognition, 2020, 1577-1586,. 10.1109/cvpr42600.2020.00165 [百度学术]
Yu F, Koltun V. Multi-Scale Context Aggregation by Dilated Convolutions[C]. International Conference on Learning Representations (ICLR), 2016. 10.1109/cvpr.2017.75 [百度学术]
Li L, Xu M, Liu H, et al. A Large-Scale Database and a CNN Model for Attention-Based Glaucoma Detection[J]. IEEE Trans. Med. Imaging, 2019, 39,413–424, . 10.1109/tmi.2019.2927226 [百度学术]
Woo S, Park J, Lee J, et al. CBAM: Convolutional Block Attention Module[C]. the European Conference on Computer Vision (ECCV), 2018. 10.1007/978-3-030-01234-2_1 [百度学术]
Li X, Wang W, Hu X, et al. Selective Kernel Networks[C]. Conference on Computer Vision and Pattern Recognition, 2019. 10.1109/cvpr.2019.00060 [百度学术]
Hu J, Shen L, Albanie S, et al. Squeeze-and-Excitation Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020. 42, (8):2011-2023, ,. 10.1109/tpami.2019.2913372 [百度学术]
Howard A , Sandler M, Chu G, et al. Searching for MobileNetV3[C]. IEEE/CVF International Conference on Computer Vision (ICCV), 2019,,1314-1324,. 10.1109/iccv.2019.00140 [百度学术]
Yang X, Sun H, Fu K, et al. Automatic Ship Detection in Remote Sensing Images from Google Earth of Complex Scenes Based on Multiscale Rotation Dense Feature Pyramid Networks[J]. Remote Sens. 2018, 10, 132. 10.3390/rs10010132 [百度学术]
Wei S, Zeng X, Qu Q, et al. HRSID: A High-Resolution SAR Images Dataset for Ship Detection and Instance Segmentation[J]. IEEE Access, 2020,,8: 120234-120254,. 10.1109/access.2020.3005861 [百度学术]