网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于非凸低秩塔克分解的红外小目标检测方法  PDF

  • 杨俊刚 1
  • 刘婷 1,2
  • 刘永贤 1
  • 李博扬 1
  • 王应谦 1
  • 盛卫东 1
  • 安玮 1
1. 国防科技大学 电子科学学院,湖南 长沙,410073; 2. 湘潭大学 自动化与电子信息学院,湖南 湘潭,411100

中图分类号: TP753

最近更新:2025-04-27

DOI:10.11972/j.issn.1001-9014.2025.02.018

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

低秩稀疏分解方法因其好的检测性能在红外小目标检测领域受到广泛关注。然而,现有低秩稀疏分解方法在复杂场景中仍然面临检测性能不高、检测速度较慢等问题。虽然现有的低秩塔克分解方法在复杂场景下取得了令人满意的检测性能,但其需依赖经验预先定义秩:若秩估计过大或过小,会导致漏检或虚警。而且,不同场景中秩的大小不一样,限制了实际应用。为了解决这一问题,本文采用非凸秩接近范数约束低秩塔克分解的潜在因子,无需手动设置秩,从而显著提升了算法在不同场景中的鲁棒性。进一步地,设计了基于对称高斯-赛德尔的交替方向乘子法(symmetric GaussSeidel based alternating direction method of multipliers algorithm,sGSADMM)来求解所提模型。与现有基于交替方向乘子法相比,sGSADMM算法通过利用更多结构信息,实现了更高的求解精度。大量实验表明,所提方法在检测性能和背景抑制等方面均优于现有的先进算法。

引言

红外小目标探测在国防预

1、航空航天技23和海事领45等多种实际应用中发挥着至关重要的作用。近年来,低秩稀疏分解方法在红外小目标检测领域得到了迅速发展。然而,由于红外目标成像距离较远,往往缺乏有效的形状和纹理信息。因此,研究复杂场景下的红外小目标检测是一项具有挑战性的任务。

现有的红外小目标检测方法可以分为基于滤波的方法、基于人类视觉对比机制的方法、基于低秩稀疏分解的方法和深度学习的方法这四大类。第一类是基于滤波的方法,基于滤波的方法主要通过不同的滤波器来评估背景,如顶帽变换 (top-hat transformation, Top-hat)算

6、最大中值滤波器 (max-mean filter, Max-mean)算7 。基于滤波的方法检测效率很高,但是检测结果中背景杂波残留较多。

第二类是基于人类视觉对比机制的方法,受人类视觉系统对比机制的启发,Chen

8开创性地设计了一种局部对比度测量 (local contrast measure, LCM) 算法。该算法通过提高目标和背景之间的对比度来增强目标的显著度,通常适用于目标和背景对比度差异较大的场景,而且在增强目标的同时还会增强背景,检测效率不高。

第三类是基于低秩稀疏分解的方法。近年来,低秩稀疏分解方法引入到红外小目标检测领域,Gao

9首先设计了红外块图像模型。为了提高复杂场景下的检测性能,Wang10提出了一种新的稳定多子空间学习方法;Zhang11提出了一种非凸秩近似模型(non-convex rank approximation model NRAM),该模型使用l2,1范数约束背景杂波。为了充分利用图像的信息,Dai12进一步将局部图像块堆叠成三维张量,提出了重加权红外块张量(reweighted infrared patch-tensor, RIPT)模型。考虑到RIPT方法的有效性,提出了许多改进的张量范数来更准确地评估背1314。此外,Liu15结合深度去噪器先验和低秩先验来更好地检测复杂噪声场景中的红外小目标。在文献[16]中,结合低秩塔克分解和多形态轮廓方法,在复杂场景中更准确地检测目标。然而,上述方法忽略了时域信息,在红外序列小目标检测中性能不佳。

为了充分地利用时域信息,Sun

17设计了一种新的时空块张量模型,该模型通过最小化加权Schatten p范数(WSNMSTIPT)来更准确地评估背景。随后,Sun18将二维总变分正则项扩展到三维时空总变分正则项,以更好地去除噪声和利用时域信息(STTV-WNIPT)。受STTV-WNIPT方法的启发,Liu19将非凸张量低秩近似与非对称时空总变分正则项相结合用于红外小目标检测。为了准确地区分稀疏背景和目标成分,Zhang20设计了一种基于边角感知的时空张量(edge and corner awareness-based spatial-temporal tensor,ECASTT)模型。为了进一步提高现有方法在复杂场景中的检测能力,Sun21在现有的时空域张量模型中引入了多子空间学习策略。但上述方法忽略了局部信息的有效性,影响了检测性能。因此,Liu22将局部信息与通过采集时空块立方体,建立了一种新的时空张量模型。Wang23进一步建立了非重叠块时空张量(NPSTT)模型。Luo24将改进的多模核范数( improved multi-mode nuclear norm,IMNN)和局部加权熵对比( local weighted entropy contrast, LWEC)整合为一个统一的框架,提出了一种IMNN-LWEC模型,提高了目标检测能力。Liu 25提出了基于描述系数总变分正则项的快速的红外小目标检测,该方法可以在复杂场景中快速准确地检测红外小目标,但是需要预先根据经验提前设置秩,不满足实际工程的应用。Liu26进一步提出了一种新的图构造方式来描述背景的低秩性,并且提出了新的基于图拉普拉斯正则项的红外小目标检测方法。受文献[16]的启发,Pang27将分面模型与低秩塔克张量分解方法相结合用于小目标检测。Li28基于目标在时空域中的局部连续性,通过透视转换建立扭转张量模型,使复杂的背景成分更加结构化,增加了背景与目标之间的差异,提出了一种用于红外小目标检测的稀疏正则化扭曲张量模型(SRSTT)。为了在复杂的场景中取得好的检测性能,Luo29提出了基于聚类和跟踪引导的红外小目标时空预测补全模型来检测红外小目标。为了更充分地利用时空域信息,Wu30设计了一种时空四维张量环( 4D tensor ring , 4D-TR)和四维张量列(4D tensor train, 4D-TT)方法来检测红外小目标。进一步地,Luo31提出了一种基于块项分解范数和多方向导数先验的4D时空张量分解的红外小目标检测方法。尽管上述方法在复杂场景中取得了好的检测性能,但是上述方法计算复杂度高,检测速度慢,不满足实时检测。

第四类方法是基于深度学习的方法,近年来,基于数据驱动的深度学习方法逐渐成为红外小目标检测领域新的研究热点。Li

32提出了一种基于密集嵌套并融合注意力模块的红外小目标 检 测 网 络(dense nested attention network,DNANet)。进一步地,Ying等提出了采用单点监督的方式训练红外小目标检测网络的策33。为了提高检测网络的检测速度,一些轻量化的红外小目标检测网络被提了出34。尽管基于深度学习的方法获得了较好的检测性能,但是深度学习方法非常依赖数据和标签的数量和质量,当训练数据不够或者标签不准确时,检测性能会下降。

考虑到现有的低秩稀疏分解方法在复杂场景中计算复杂度高、检测速度慢的问题,虽然现有的基于低秩塔克分解的方法在复杂场景下已经取得了令人满意的检测性能,但现有的基于塔克分解的方法需要提前选择塔克秩,不同场景中秩的大小是不一样的,这不适用于实际场景和实际工程中的应用。针对秩选择问题,提出了基于非凸张量塔克分解的红外小目标检测方法。图1展示了本文所提方法的流程图。在本文所提方法中,采用非凸秩接近范数约束低秩塔克分解的潜在因子,这避免了根据经验提前设置秩,提高了算法在不同场景中的鲁棒性。同时,为了使用更多的结构信息,设计了基于对称高斯-赛德尔的交替方向乘子法(sGSADMM)来求解所提模型。综上,所提NFTD-sGSADMM算法有以下三个创新点:

图1  所提方法的整体流程图

Fig.1  The overall flow chart of the proposed method

(1) 本文采用非凸秩接近范数约束低秩塔克分解方法的潜在因子,避免了根据经验提前设置秩,有效提高算法的鲁棒性。同时,对因子矩阵施加低秩约束可以降低计算复杂度,提高计算效率。

(2) 设计基于对称高斯-赛德尔的交替方向乘子法来求解提出的模型。与直接使用交替方向乘子法相比,基于对称高斯-赛德尔的交替方向乘子法可以利用更多的结构信息,从而获得更高的检测精度。

(3) 为了证明NFTD-sGSADMM模型的有效性,在六种不同的红外场景下进行了实验。大量的实验结果表明,所提方法在检测精度和背景抑制这两个方面都具有优越的性能。

1 相关知识介绍

1.1 低秩塔克分解

塔克分解的数学定义式表示如下:

𝒳=𝒢×1U1×2U2×NUN , (1)

式(1)中,Ui𝒢分别表示因子矩阵和核张量。假设三维张量的维度为m×n×b,并且假定塔克分解的秩为r=r1,r2,r3,其中r1,r2,r3分别是对应于三个维度的秩,那么,分解后得到的三个因子矩阵的大小表示如下:因子矩阵U1的大小为m×r1,因子矩阵U2的大小为n×r2,因子矩阵U3的大小为b×r3。近年来,低秩塔克分解方法在红外小目标检测中取得了较好的检测性

1627。然而,现有的低秩塔克分解方法需要根据经验预先定义秩,而不准确的预定义秩可能导致漏检或虚警等问题。对于秩选择问题,Tian30首先证明了模n展开的秩上界为相应因子矩阵的秩。因此,可以利用核范数来约束低秩塔克分解的因子矩阵(factor matrices of Tucker decomposition , FTD)来检测红外小目标。FTD的定义式表示如下:

K𝒳=βnn=1NUn*+λ𝒢F2 , (2)

其中,𝒳表示输入的张量,*表示核范数,F2表示Frobenius范数,βnλ是常数。

2 本文方法

对于一个给定的红外图像,其数学模型表示如下:

fO=fB+fS , (3)

其中,fOfBfS分别表示输入红外图像、背景图像和目标图像。根据文献[

13],式(3)的时空张量模型表示如下:

𝒪=+𝒮 , (4)

其中,𝒪𝒮分别表示输入红外图像张量、背景张量和目标张量。

2.1 基于因子先验的非凸张量塔克分解方法

受到文献[

35]中FTD的启发,考虑到核范数同等的对待每一个奇异值,在一些场景中检测性能受限,这主要是因为核范数忽略了不同的奇异值有不同的重要性,应该区别对待。针对这一问题,采用文献 [ 36] 中提出的非凸秩接近范数,称之为γ范数,其定义式如下:

Bγ=i(1+γ)σiBγ+σiB,γ>0 . (5)

基于此,新的基于因子先验的非凸张量塔克分解NFTD的定义式如下所示:

  K1𝒳=βnn=1NUnγ+λ𝒢F2 . (6)

综上所述,为了解决现有低秩塔克分解方法的秩选择问题,本文提出了基于因子先验的非凸张量塔克分解的红外小目标检测方法,模型表示如下:

min,𝒮βnn=1NUnγ+λ1𝒢F2+λ2𝒮1
s.t.=𝒢×1U1×2U2×NUN,𝒪=+𝒮 , (7)

其中,λ1λ2表示正的正则化参数。

2.2 本文模型的优化求解

通过引入辅助变量Wnn=1N式(7)构建成如下形式:

min,𝒮βnn=1NUnγ+λ1𝒢F2+λ2𝒮1
s.t.Wn=Unn=1N,𝒪=+𝒮,=𝒢×1W1×2W2×NWN . (8)

然后,增广拉格朗日函数表示如下:

LUn,Wn,,𝒮,𝒢,δn,Λ,Γ=βnn=1NUnγ+λ1𝒢F2+λ2𝒮1+n=1Nρ2Wn-UnF2+n=1Nδn,Wn-Un+ρ2-𝒢×1W1×2W2×NWNF2+ρ2𝒪--𝒮F2+Γ,-𝒢×1W1×2W2×NWN , (9)

其中,δnΓΛ表示拉格朗日乘子,ρ表示惩罚参数。图2展示了ADMM算法和sGSADMM算法的比较。从图2(a)中可以看出,ADMM在一个周期内按顺序更新所有变量,并平等对待每个变量。如图2 (b)所示,可以看到sGSADMM在每次迭代中更新所有变量,然后重复更新一些变量,形成对称迭代结构。与ADMM相比,sGSADMM可以充分利用式(8)中的非光滑结构信息,因此可以获得更高的检测精度。接下来,我们使用sGSADMM将式(9)分解为几个子问题,然后交替迭代更新每个变量。

图2  ADMM算法和sGSADMM算法的比较:(a) ADMM算法;(b) sGSADMM算法

Fig. 2  Comparison of ADMM algorithm and sGSADMM algorithm: (a) ADMM algorithm; (b) sGSADMM algorithm

1)固定其他变量,更新Un

Un=argminUnβnn=1NUnγ+n=1Nρ2Wn-Un+δnρF2 . (10)

式(10)的闭式解表示如下:

Un=DβnρWn+δnρ .. (11)

2) 固定其他变量,更新Wn

3) Wn=argminWnn=1Nρ2Wn-Un+δnρF2+ρ2-𝒢×1W1×2W2×NWN+ΓρF2 . (12)

根据文献[

30]中的Lemma 1,式(12)改写成如下形式:

           Wn=argminWnn=1Nρ2Wn-Un+δnρF2+ρ2Bn-WnGnW\nΤ+ΓnρF2 . (13)

然后,Wn的解的形式如下所示:

Wn=-δn+ρUn+Γn+ρBnW\nGnΤρΙ+ρGnW\nΤW\nGnΤ . (14)

其中,W\n=WNWn+1Wn-1W

4)固定其他变量,更新

=argminρ2𝒪--𝒮+ΛρF2+ρ2-𝒢×1W1×2W2×NWN+ΓρF2 . (15)

式(15)的解的形式表示如下:

=-Γ+ρH+ρ𝒪-𝒮+Λ2ρ , (16)

其中,H=𝒢×1W1×2W2×NWN

5)固定其它变量,更新𝒢

𝒢=argmin𝒢λ1𝒢F2+ρ2-𝒢×1W1×2W2×NWN+ΓρF2 . (17)

为了求解式(17),采用Lemma 1中的方法将核张量展开为n-th的模Gn式(17)改写成如下形式:

Gn=argminGnλ1GnF2+ρ2n-WnGnW\nΤ+ΓρF2 . (18)

利用Kronecker积与vecAMC=CΤAvecM的性质,结合最优性条件,更新𝒢的表示形式如下:

vecG=vecWnΤΓn+ρBnW\nW\nΤW\nρWnΤWn+2λ1Ι , (19)

其中,vec表示其将张量或矩阵的列叠加成单个列向量的操作。

6)固定其他变量,更新𝒮

S=argmin𝒮λ2𝒮1+ρ2𝒪--𝒮+ΛρF2. (20)

根据文献[

21],式(20)的解表示如下:

𝒮=Thλ2ρ𝒪-+Λρ (21)

其中,Th表示软阈值收缩算子。

7)固定其他变量,更新δnn=1N

δn=δn+ρWn-Un,Γ=Γ+ρ-𝒢×1W1×2W2×NWN.Λ=Λ+ρ𝒪--𝒮. (22)

7)固定其他变量,更新ρ

ρ=min μρ, ρmax . (23)

算法1中总结了求解本文方法NFTD-sGSADMM的详细步骤。

算法1   本文的NFTD-sGSADMM算法

  1.输入. 红外图像序列, OB0=S0=0L,H,λ1λ2ρ0=0.01ρmax=1e7μ=1.5ζ=1e-6

  2.重复以下步骤,直到满足停止条件:

  步骤1. 根据式(11)更新Un

  步骤2. 根据式(14)更新Wn

  步骤3. 根据式(16)更新B

  步骤4. 根据式(19)更新G

  步骤5. 根据式(21)更新S

  步骤6. 根据式(16)更新B

  步骤7. 根据式(14)更新Wn

  步骤8. 根据式(11)更新Un

  步骤9 根据式(22)更新δnn=1NΓΛ

  步骤10. 根据式(23)更新ρ

  步骤11. 检查是否达到收敛条件O-B-SF2OF2ζ

  3.输出. 背景图像B,目标图像S

2.3 计算复杂度分析

这一章节主要讨论本文所提NFTD-sGSADMM算法的计算复杂度。假定输入红外张量为𝒪n1×n2×n3,更新Un需要的计算复杂度为On13+n23+n33。同理,更新Wn的计算复杂度为On13+n23+n33。更新𝒢的计算复杂度为On1n2n33。更新需要进行张量矩阵乘积计算,需要的计算复杂度为Oi=1Nnim=1Nnm,更新𝒮需要进行软阈值收缩计算,需要的计算复杂度为On1n2n3

2.4 收敛性分析

在这一章节中,主要分析本文所提NFTD-sGSADMM算法的收敛性。由于NFTD正则项的存在,式(7)的求解过程是一个非凸优化问题。基于此,根据文献[

37]中的定理3,采用收敛条件𝒪--𝒮F2𝒪F2ζ来分析收敛性。在序列6上的收敛曲线如图3所示。从图3可以看出,随着迭代次数的增加,相对误差值可以快速收敛到零。这说明本文所提NFTD-sGSADMM方法可以快速收敛并获得最优解。

图3  所提方法在序列6上的收敛曲线

Fig. 3  The convergence curve of the proposed method on Sequence 6

3 实验结果与分析

3.1 评价指标与数据集

3.1.1 评价指标

本文采用检测率(probability of detection, Pd)和虚警率(false-alarm rate, Fa),3D受试者工作特征(3D receiver operating characteristic, 3D ROC) 曲线和AUC指标来评估检测性能和背景抑制能力,其中,3D ROC曲线由3个2D ROC曲线组成,分别是2D ROC曲线 Fa,Pdτ,Pdτ,Fa。三个2D ROC对应的AUC指标分别表示为AUCFa,PdAUCτ,PdAUCτ,Fa。评价指标的定义和公式如下所示:

1) 检测率的计算公式如下:

Pd=NdNg , (24)

其中,NdNg分别表示检测到的真实像素数和真值图中的真实像素数。

2) 虚警率的计算公式如下:

Fa=NfNt , (25)

其中,NfNt分别表示检测到的错误像素数和检测到的总像素数。

3)AUCOA的计算公式如下:

AUCOA=AUCFa,Pd+AUCτ,Pd-AUCτ,Fa . (26)

4)AUCSNPR的计算公式如下:

AUCSNPR=AUCτ,PdAUCτ,Fa . (27)

3.1.2 数据集分析

为了验证本文方法和对比方法在复杂场景中的检测性能,我们的数据集包含6组地面场景。序列1~3的红外图像来自于文献[

38],序列4~6的红外图像来自于文献[39]。从图45可以看出,序列1~3展示的是有植被干扰的场景。序列4~6是包含有建筑物、植被干扰的场景。序列1和序列3是包含有疑似目标点干扰的地面场景,这容易造成错检和漏检。序列2的场景整体较平滑,但是包含少许高亮的植被,容易造成虚警。相较于序列1~3,序列4~6的场景更复杂,更具有挑战性。序列4包含一些山脉和路面的高亮杂波干扰。序列5中包含大块面积的高亮区域干扰,容易引起虚警。序列6包含房屋、道路等高亮杂波的干扰,容易引起虚警和漏检。综上所述,数据集包含了简单和复杂的背景,这些具有各种场景的多样化数据集可以帮助全面评估每个算法的性能。

图4  所提方法和8种对比方法在序列1~3上的定性实验结果(红色矩形框表示目标,蓝色椭圆表示背景杂波和虚警)

Fig. 4  The qualitative experimental results of the proposed method and eight compared methods on sequences 1-3 (red rectangular box represents targets, blue oval represents background clutters and false alarm)

图5  所提方法和8种对比方法在序列4~6上的定性实验结果(红色矩形框表示目标,蓝色椭圆表示背景杂波和虚警)

Fig. 5  The qualitative experimental results of the proposed method and eight compared methods on Sequences 4-6 (where red rectangular box represents targets, blue oval represents background clutters and false alarm)

3.2 参数分析

这个章节主要讨论NFTD-sGSADMM方法中的两个重要参数LH。在序列1上分析了不同参数LH对检测性能的影响,实验结果如表1所示。

表1  不同LH值在序列1中的AUC指标
Table I  AUC metrics for different L and H values in sequence 1
LHAUCFa,FdAUCτ,PdAUCτ,FaAUCOAAUCSNPR
3 8 0.9916 0.9683 0.0020 1.9579 484.15
4 8 0.9999 0.9966 0.0020 1.9945 498.30
5 8 0.9999 0.9995 0.0020 1.9974 499.75
6 8 0.9999 0.8608 0.0022 1.8585 391.27
7 8 0.9999 0.7980 0.0037 1.7942 215.68
8 8 0.9999 0.7980 0.0052 1.7927 153.46
L H AUCFa,Fd AUCτ,Pd AUCτ,Fa AUCOA AUCSNPR
5 2 0.9999 0.8804 0.1133 1.7670 7.7705
5 4 0.9999 0.8529 0.0335 1.8193 25.460
5 6 0.9999 0.8176 0.0078 1.8097 104.82
5 8 0.9999 0.9995 0.0020 1.9974 499.75
5 10 0.9999 0.9974 0.0020 1.9953 498.70

1)帧数:为了测试不同L值对检测性能的影响,将L在[3-7]的范围内以1的步长变化。不同L值对应的AUC指标列在表1中。从表1中可以看到,过大的L值对应的AUCτ,Fa的值越大,AUCτ,Pd的值越小,这说明检测结果中有较多背景杂波残留。L值较小的AUCτ,Pd值也偏小,这说明检测能力较弱,从表1中可以看到,L=5AUCOAAUCSNPR值最高,这说明L=5时能获得最高的检测能力和背景抑制能力。在接下来的实验中,设置L=5

2)权值参数:为了测试不同H值对检测性能的影响,将H在[2-10]的范围内以2的步长变化。不同H值对应的AUC指标列在表1中。从表1中可以看到,当H=2时,AUCτ,Fa的值最大,这说明检测结果中背景杂波残留最多。随着H值增大,AUCτ,Fa值逐渐降低,这说明背景抑制能力逐渐增强。当H=8时,取得最高的AUCOA值和AUCSNPR值,这说明H=8时能取得最高的检测能力和背景抑制能力。在接下来的实验中,设置H=8

3.3 对比实验分析

为评估本文所提方法在检测精度和背景抑制等方面的综合性能,与领域内现有的8种不同的检测方法进行比较,包括两个基于单帧的方法(Top-hat方法,NRAM方法)和6个基于序列的方法(ECASTT,MSLSTIPT,ASTTV-NTLA,IMNN-LWEC,SRSTT,4D-TT)。定量和定性结果分析显示,本文提出的NFTD-sGSADMM方法在不同的场景中都能取得好的检测性能和背景抑制性能。具体分析过程见3.3.1和3.3.2节。

3.3.1 定性分析

为了验证本文方法的检测性能,本文在序列1~6上与8种不同的检测算法进行比较。图4~5展示了不同算法的检测结果。从图4~5中可以看出,Top-hat方法在6个不同的场景中都有较多的背景杂波残留,这是因为Top-hat方法结构设计简单,计算复杂度低,适用于简单均匀的场景。由于序列1~6都是地面场景,包含较多的杂波干扰,因此Top-hat方法在序列1~6上的检测性能降低。相较于Top-hat方法,NRAM方法在不同场景中背景杂波残留较少,但在序列1和序列3中,NRAM方法过收缩目标,目标能量较低。这主要是因为序列1和序列3是包含有疑似目标点干扰的地面场景,这容易造成错检和漏检,检测性能会下降。从图45中可以看出,ECASTT方法 虽然能够在很大程度上提高目标和背景之间的对比度,但是ECASTT方法在序列4~6上仍然有背景杂波残留,这是因为序列4~6包含有建筑物、植被等干扰,容易带来虚警。从图4~5中可以看出,MSLSTIPT和ASTTV-NTLA方法都能较好地保留目标,但是它们的检测结果通常呈现灰色,尤其是序列2、序列5~6等包含高亮杂波干扰的场景,这说明MSLSTIPT和ASTTV-NTLA方法不能很好地抑制高亮杂波背景。相较之下,IMNN-LWEC,SRSTT和4D-TT方法能够很好地抑制背景杂波,但是IMNN-LWEC方法通常过收缩目标,目标强度较弱。这说明它的目标检测能力有待进一步提高。从图45中可以看到,本文提出的NFTD-sGSADMM方法在增强目标的同时可以很好地抑制背景杂波,检测结果中几乎没有杂波的残留,说明NFTD-sGSADMM方法在不同的场景中检测性能和背景抑制能力都高于其他的对比方法。

3.3.2 定量分析

接下来,采用3D ROC曲线和5个不同的AUC指标来定量评估不同方法在序列1~6上的检测性能。图6展示了不同方法在序列1~6上的3D ROC曲线。为了突出不同方法之间的差异,在虚警率轴上采用对数刻度。2D ROC曲线Fa,Pd越靠近坐标轴的左上角表明检测器的整体检测性能越好,2D ROC曲线τ,Pd越靠近坐标轴的右上角表明检测器的检测能力越强,2D ROC曲线τ,Fa越靠近坐标轴的左下角表明检测器的背景抑制能力越强。从图6中可以看到,MSLSTIPT、SRSTT、4D-TT和NFTD-sGSADMM方法的 2D ROC曲线Fa,Pd可以较快速地接近坐标轴的左上角。这表明它们在整体检测性能方面的表现较好。然而,MSLSTIPT 方法的二维ROC曲线τ,Fa偏离坐标轴的左下角,说明它抑制背景杂波的能力较弱。相较之下,IMNN-LWEC、4D-TT和本文所提NFTD-sGSADMM方法的2D ROC曲线τ,Fa可以快速接近坐标轴的左下角。这说明它们有着更好的抑制背景杂波的能力。从图6中可以看出,NRAM、4D-TT和SRSTT方法的2D ROC曲线τ,Pd低于其他方法,说明这些方法过收缩目标、检测能力有待进一步提高。综上所述,本文所提NFTD-sGSADMM方法具有较高的检测能力和较强的背景抑制能力。

图6  所提方法和对比方法在序列1~6上的3D ROC曲线,每一行从左到右分别表示3D ROC曲线、2D ROC曲线Fa,Pd、 2D ROC曲线τ,Pd、2D ROC曲线τ,Fa

Fig. 6  3D ROC curves for the proposed method and compared methods on Sequences 1-6. Each row from left to right represents 3D ROC, 2D ROC Fa,Pd, 2D ROC τ,Pd,2D ROC τ,Fa

由于一些对比方法的ROC曲线重叠在一起,进一步采用AUC 指标来评估各个对比方法之间的性能,如表2所示。粗体表示最佳结果,下划线表示表现第二佳的结果。如表2所示,在序列5中,ASTTV-NTLA方法的AUCτ,Pd值最大。在序列6中,Top-hat方法的AUCτ,Pd值最大。在序列1~3中,本文所提的NFTD-sGSADMM方法的AUCτ,Pd最大。这说明上述三个方法的检测能力较强。然而,ASTTV-NTLA方法和Top-hat方法在序列1~6上的 AUCτ,Fa值较高,说明ASTTV-NTLA方法和Top-hat方法不能很好地抑制复杂地面场景中的高亮杂波。这也进一步导致了ASTTV-NTLA和Top-hat 方法在序列1~6上的 AUCOAAUCSNPR 值较低。从表2中可以看出,IMNN-LWEC、SRSTT、4D-TT和本文所提NFTD-sGSADMM方法的AUCτ,Fa最低,说明它们在序列1~6上能够很好地抑制背景杂波的干扰,能够准确地评估背景。但是IMNN-LWEC、SRSTT和4D-TT的AUCτ,Pd值不高,说明上述三个方法在序列1~6上过收缩目标,这也导致 AUCOA 值较低,这说明它们的检测能力有待提升。从表2可以看出,本文所提NFTD-sGSADMM方法在序列1~6上都可以取得高的AUCOAAUCSNPR值,说明NFTD-SGSADMM方法在6组场景中都能很好地抑制高亮杂波干扰和疑似目标的高亮杂波点干扰。综上所述,NFTD-sGSADMM方法在不同难度的地面场景中都能取得好的检测性能,并且具有较强的鲁棒性。这得益于从因子矩阵中可以挖掘数据更多的潜在结构信息,可以帮助提高检测性能,同时,采用对称高斯-赛德尔的交替方向乘子法来求解提出的模型可以利用更多的结构信息,从而获得更高的检测精度。

表2  不同方法在序列 1~6上的检测性能评价
Table 2  Evaluation of detection performance of different methods on Sequences 1-6.
场景指标Top-hatNRAMECASTTMSLSTIPTASTTV-NTLAIMNN-LWECSRSTT4D-TTNFTD-sGSADMM
0.9999 0.9958 0.9999 0.9999 0.9999 0.9958 0.9999 0.9999 0.9999
0.9941 0.9835 0.9577 0.9000 0.9863 0.9936 0.7863 0.8059 0.9995
序列1 0.0512 0.0020 0.0082 0.0752 0.0300 0.0020 0.0020 0.0020 0.0020
1.9428 1.9773 1.9494 1.8247 1.9562 1.9874 1.7842 1.8038 1.9974
19.416 491.75 116.79 11.968 32.877 496.80 393.15 402.95 499.75
0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
0.7902 0.7157 0.9682 0.9866 0.9431 0.8569 0.7667 0.8882 0.9830
序列2 0.0270 0.0020 0.0022 0.2867 0.0439 0.0020 0.0020 0.0020 0.0020
1.7631 1.7136 1.9659 1.6998 1.8991 1.8548 1.7646 1.8861 1.9809
29.267 357.85 440.09 3.4412 21.483 428.45 383.35 444.10 491.50
0.9999 0.9999 0.9998 0.9999 0.9999 0.9915 0.9999 0.9999 0.9999
0.9617 0.9549 0.7065 0.8255 0.8176 0.9056 0.8216 0.8176 0.9667
序列3 0.0309 0.0020 0.0051 0.0643 0.0455 0.0022 0.0020 0.0020 0.0020
1.9307 1.9528 1.7012 1.7611 1.7720 1.8949 1.8195 1.8155 1.9646
31.123 477.45 138.53 12.838 17.969 411.64 410.80 408.80 483.35
0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
0.9667 0.9353 0.9766 0.9471 0.9984 0.9863 0.9510 0.9392 0.9947
序列4 0.0247 0.0020 0.0034 0.0741 0.0204 0.0020 0.0020 0.0020 0.0020
1.9419 1.9332 1.9731 1.8729 1.9779 1.9842 1.9489 1.9371 1.9926
39.138 467.65 287.24 12.781 48.941 493.15 475.50 469.60 497.35
0.9999 0.8999 0.9995 0.9999 0.9999 0.9916 0.9999 0.9999 0.9999
0.9878 0.7855 0.7130 0.9846 0.9976 0.9853 0.9667 0.9627 0.9911
序列5 0.0479 0.0022 0.0099 0.3427 0.1384 0.0020 0.0020 0.0020 0.0020
1.9398 1.6832 1.7026 1.6418 1.8591 1.9749 1.9646 1.9606 1.9890
20.622 357.05 72.020 2.8731 7.2081 492.65 483.35 481.35 495.55
0.9999 0.9874 0.9999 0.9999 0.9999 0.9833 0.9999 0.9999 0.9999
1.0000 0.7614 0.8175 0.9000 0.9976 0.9290 0.8529 0.9392 0.9812
序列6 0.0521 0.0021 0.0075 0.1386 0.1776 0.0021 0.0020 0.0020 0.0020
1.9478 1.7467 1.8099 1.7613 1.8199 1.9102 1.8508 1.9371 1.9791
19.194 362.57 109.00 6.4935 5.6171 442.38 426.45 469.60 490.60

3.4 消融实验

3.4.1 基于因子先验的非凸张量塔克分解

在本文所提NFTD-sGSADMM方法中,基于因子先验的非凸张量塔克分解是为了避免根据经验选择提前设置秩和更准确地评估背景。为了证明NFTD正则项的有效性,引入了基于因子先验的塔克分解FTD正则项进行比较,表3列出了NFTD和FTD在序列4~6上的比较结果。从表3中可以看出,NFTD-ADMM方法的AUCτ,Pd值和AUCOA值高于FTD-ADMM方法,NFTD-sGSADMM方法的AUCOAAUCτ,Pd值要高于FTD-sGSADMM方法。这说明NFTD正则项能够更准确地评估背景,这主要是因为与核范数相比,非凸张量秩接近范数能够更准确地逼近塔克秩。同时,从表3中可以看出,在序列4~6上,NFTD-ADMM方法的AUCSNPR值要高于FTD-ADMM方法,NFTD-sGSADMM方法的 AUCSNPR值要高于FTD-sGSADMM方法,这说明NFTD正则项的背景抑制能力比FTD正则项的背景抑制能力强。

表3  消融实验相关的性能评价
Table 3  Performance evaluation related to ablation experiments
场景指标FTD-ADMMFTD-sGSADMMNFTD-ADMMNFTD-sGSADMM
0.9833 0.9999 0.9999 0.9999
0.8888 0.9881 0.9865 0.9947
序列4 0.0020 0.0020 0.0020 0.0020
1.8701 1.9860 1.9844 1.9926
444.40 494.05 493.25 497.35
0.9999 0.9958 0.9999 0.9999
0.9941 0.9751 0.9814 0.9911
序列5 0.0199 0.0020 0.0020 0.0020
1.9741 1.9689 1.9793 1.9890
49.955 487.55 490.70 495.55
0.9999 0.9749 0.9916 0.9999
0.9314 0.9411 0.9600 0.9812
序列6 0.0217 0.0020 0.0020 0.0020
1.9096 1.9140 1.9496 1.9791
42.922 470.55 480.00 490.60

3.4.2 对称高斯-赛德尔的交替方向乘子法

为验证高斯-赛德尔的交替方向乘子法(sGSADMM)的有效性,引入了交替方向乘子法(ADMM)进行比较,表3列出了sGSADMM和ADMM在序列4~6上的比较结果。从表3中可以看出,FTD-sGSADMM方法的AUCτ,Pd值和AUCOA值高于FTD-ADMM方法,说明FTD-sGSADMM方法的检测能力高于FTD-ADMM方法。这是因为与直接使用ADMM算法求解模型相比,采用对称高斯-赛德尔的交替方向乘子法可以利用更多的结构信息,有助于更准确地检测目标。同时,从表3中可以看出,NFTD-sGSADMM方法的AUCSNPR值高于NFTD-ADMM方法,说明采用对称高斯-赛德尔的交替方向乘子法有助于更好地抑制背景杂波,从而更准确地评估背景,进一步提高检测性能。综上所述,结合NFTD正则项和sGSADMM算法可以提高方法的检测能力和背景抑制能力。

3.5 运行时间分析

对于检测器来说,算法的计算效率是红外小目标检测研究的一个主要关注点。在这一章节中,分析了本文方法和对比方法在6组场景中的运行时间。表4中列出了这些方法平均处理每帧图像需要的时间。如表4所示,Top-hat方法在所有对比算法中运行时间最短、计算效率最高。这主要得益于其基于滤波的简单结构设计和较低的算法复杂度。然而,基于滤波的方法仅适用于背景简单均匀的场景,在复杂场景中会出现明显的背景杂波残留问题。从表4可以看出,基于低秩稀疏分解的方法普遍需要较长的计算时间。其中,NRAM方法的单帧图像处理时间比利用时域信息的方法(如MSLSTIPT、ASTTV-NTLA和IMNN-LWEC)更短,这主要得益于NRAM方法无需构造时空张量,从而显著减少了计算耗时。如表4所示,SRSTT方法的单帧图像处理时间是所有对比方法中最长的。这主要是由于该方法在张量构造过程中未采用块构建操作,导致生成的张量维度很大,因而耗时较多。除SRSTT方法外,ECASTT方法同样表现出较长的计算耗时。这主要归因于其非局部总变分正则项(NLTV)带来的额外计算复杂度。在基于低秩稀疏分解的方法中,4D-TT方法展现出比其他同类方法更短的计算时间。这得益于该方法直接在因子矩阵上进行运算,有效降低了计算复杂度。然而,其4D张量的构造过程仍是一个相对耗时的操作。相较于上述方法,本文提出的NFTD-sGSADMM方法在单帧图像处理时间上仅次于Top-hat方法,这主要得益于该方法对因子矩阵施加的低秩约束。这种约束不仅能够充分挖掘数据的潜在结构信息,还能有效降低计算复杂度,提升计算效率。实验结果表明,NFTD-sGSADMM方法在保持较高检测性能的同时,还具有较快的检测速度。

表4  本文方法和对比方法在六个场景中的时间对比
Table 4  Time comparison of the proposed method and the compared methods in six scenes.
序列1序列2序列3序列4序列5序列6
Top-hat 0.0043 s 0.0042 s 0.0042 s 0.0042 s 0.0050 s 0.0041 s
NRAM 1.3736 s 0.9492 s 1.3235 s 1.4354 s 1.2867 s 1.3546 s
ECASTT 4.7305 s 4.8508 s 4.7872 s 4.7385 s 4.9369 s 4.6887 s
MSLSTIPT 2.1905 s 2.2949 s 2.2691 s 2.2357 s 2.2702 s 2.2541 s
ASTTV-NTLA 1.9818 s 1.8454 s 1.8661 s 1.7746 s 1.8840 s 1.8520 s
IMNN-LWEC 2.5232 s 2.5428 s 2.5530 s 2.6821 s 2.5472 s 2.7229 s
SRSTT 13.994 s 12.236 s 13.235 s 14.389 s 14.287 s 14.566 s
4D-TT 0.9129 s 0.9272 s 0.9319 s 0.9310 s 0.9881 s 0.9635 s
NFTD-sGSADMM 0.1807 s 0.1795 s 0.2418 s 0.1778 s 0.4583 s 0.4309 s

4 结论

本文提出了一种基于因子先验的非凸张量塔克分解的红外小目标检测方法。具体结论如下:

(1) 针对现有低秩塔克分解方法需要根据经验提前设置秩、在不同场景中秩的大小不一样、工程适用性差的问题,本文采用非凸秩接近范数约束低秩塔克分解方法的潜在因子,避免了根据经验提前设置秩,有效提高了算法的鲁棒性。同时,对因子矩阵施加低秩约束降低了计算复杂度,提高了计算效率。

(2) 与现有低秩稀疏分解方法不同,本文提出一种基于对称高斯-赛德尔的交替方向乘子法来求解所提模型。相较于传统ADMM,sGSADMM通过利用模型潜在的结构信息,显著提升了检测精度。

综上所述,本文提出的NFTD-sGSADMM方法通过整合NFTD正则项和sGSADMM算法,有效解决了传统方法需要凭经验预先设定秩的问题,从而显著提升了算法在不同场景下的鲁棒性。定性和定量实验结果表明,本文提出的NFTD-sGSADMM算法在检测能力和背景抑制能力方面均优于对比方法。尽管该方法在复杂场景下仍能保持良好的检测性能和较快的检测速度,但由于依赖手动调节正则化参数,其在实际应用中的泛化能力仍存在不足。受深度展开方法的启发,未来工作将聚焦于低秩稀疏分解框架下的参数自学习研究,以进一步提升检测性能并增强方法在实际场景中的实用性。相关代码将于不久后公开在https://github.com/LiuTing20a.

References

1

Li BWang YWang Let al. Monte Carlo linear clustering with single-point supervision is enough for infrared small target detection [C]. Proceedings of the IEEE/CVF International Conference on Computer Vision20231009-1019. [百度学术] 

2

Liu TYang JLi Bet al. Infrared small target detection via nonconvex tensor tucker decomposition with factor prior [J]. IEEE Transactions on Geoscience and Remote Sensing2023601-17. [百度学术] 

3

Lin Zai-PingLuo Yi-HangLi Bo-Yanget al. Gradient-aware channel attention network for infrared small target image denoising before detection [J]. Journal of Infrared and Millimeter Waves20244302): 254-260. [百度学术] 

林再平罗伊杭李博扬.基于梯度可感知通道注意力模块的红外小目标检测前去噪网络[J]. 红外与毫米波学报20244302): 254-260. [百度学术] 

4

Li BWang LWang Yet al. Mixed-precision network quantization for infrared small target segmentation [J]. IEEE Transactions on Geoscience and Remote Sensing2024625000812. [百度学术] 

5

Lin Zai-PingLi Bo-YangLi Miaoet al. Light-weight infrared small target detection combining cross-scale feature fusion with bottleneck attention modul [J]. Journal of Infrared and Millimeter Waves2022416):1102-1112. [百度学术] 

林再平李博扬李淼. 结合跨尺度特征融合与瓶颈注意力模块的轻量型红外小目标检测网络[J]. 红外与毫米波学报2022416):1102-1112. [百度学术] 

6

Tom V TPeli TLeung Met al. Morphology-based algorithm for point target detection in infrared backgrounds [C]. Proceedings of the International Society for Optics and Photonics, SPIE199319542-11. [百度学术] 

7

Deshpande S DMeng H ERonda Vet al. Max-mean and max-median filters for detection of small-targets [C]. Proceedings of SPIE-The International Society for Optical Engineering, SPIE1999380974-83. [百度学术] 

8

Chen C L PLi HWei Y Tet al. A local contrast method for small infrared target detection [J]. IEEE Transactions on Geoscience and Remote Sensing2013521): 574-581. [百度学术] 

9

Gao CMeng DYang Yet al. Infrared patch-image model for small target detection in a single image[J]. IEEE Transactions on Image Processing20132212): 4996-5009. [百度学术] 

10

Wang XPeng ZKong Det al. Infrared dim and small target detection based on stable multisubspace learning in heterogeneous scene [J]. IEEE Transactions on Geoscience and Remote Sensing20175510): 5481-5493. [百度学术] 

11

Zhang LPeng LZhang Tet al. Infrared small target detection via non-convex rank approximation minimization joint l2,1 norm [J]. Remote Sensing20181011):1821. [百度学术] 

12

Dai YWu Y. Reweighted infrared patch-tensor model with both nonlocal and local priors for single-frame small target detection [J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing2017108): 3752-3767. [百度学术] 

13

Zhang LPeng Z. Infrared small target detection based on partial sum of the tensor nuclear norm [J]. Remote Sensing2019114): 382. [百度学术] 

14

Kong XYang CCao Set al. Infrared small target detection via nonconvex tensor fibered rank approximation [J]. IEEE Transactions on Geoscience and Remote Sensing2021601-21. [百度学术] 

15

Liu TYin QYang Jet al. Combining deep denoiser and low-rank priors for infrared small target detection [J]. Pattern Recognition2023135109184. [百度学术] 

16

Zhao MLi WLi Let al. Three-order tensor creation and tucker decomposition for infrared small-target detection [J]. IEEE Transactions on Geoscience and Remote Sensing2021601-16. [百度学术] 

17

Sun YYang JLi Met al. Infrared small target detection via spatial–temporal infrared patch-tensor model and weighted schatten p-norm minimization [J]. Infrared Physics & Technology2019102103050. [百度学术] 

18

Sun YYang JLong Yet al. Infrared small target detection via spatial-temporal total variation regularization and weighted tensor nuclear norm [J]. IEEE Access2019756667-56682. [百度学术] 

19

Liu TYang JLi Bet al. Nonconvex tensor low-rank approximation for infrared small target detection [J]. IEEE Transactions on Geoscience and Remote Sensing2021601-18. [百度学术] 

20

Zhang PZhan LWang Xet al. Edge and corner awareness-based spatial–temporal tensor model for infrared small-target detection [J]. IEEE TGRS20205912): 10708-10724. [百度学术] 

21

Sun YYang JAn W. Infrared dim and small target detection via multiple subspace learning and spatial-temporal patch-tensor model [J]. IEEE Transactions on Geoscience and Remote Sensing2020595): 3737-3752. [百度学术] 

22

Liu H KZhang LHuang H. Small target detection in infrared videos based on spatio-temporal tensor model [J]. IEEE Transactions on Geoscience and Remote Sensing20205812): 8689-8700. [百度学术] 

23

Wang GTao BKong Xet al. Infrared small target detection using nonoverlapping patch spatial–temporal tensor factorization with capped nuclear norm regularization [J]. IEEE Transactions on Geoscience and Remote Sensing2021601-17. [百度学术] 

24

Luo YLi XChen Set al. Imnn-lwec: A novel infrared small target detection based on spatial–temporal tensor model [J]. IEEE TGRS2022601-22. [百度学术] 

25

Liu TYang JLi Bet al. Representative coefficient total variation for efficient infrared small target detection [J]. IEEE Transactions on Geoscience and Remote Sensing2023611-18. [百度学术] 

26

Liu TLiu YYang Jet al. Graph Laplacian regularization for fast infrared small target detection [J]. Pattern Recognition2025158111077. [百度学术] 

27

Pang DShan TLi Wet al. Facet derivative-based multidirectional edge awareness and spatial–temporal tensor model for infrared small target detection [J]. IEEE Transactions on Geoscience and Remote Sensing2021601-15. [百度学术] 

28

Li JZhang PZhang Let al. Sparse regularization-based spatial–temporal twist tensor model for infrared small target detection [J]. IEEE Transactions on Geoscience and Remote Sensing2023611-17. [百度学术] 

29

Luo YLi XWang Jet al. Clustering and tracking-guided infrared spatial-temporal small target detection [J]. IEEE Transactions on Geoscience and Remote Sensing2024625002520. [百度学术] 

30

Wu FYu HLiu Aet al. Infrared small target detection using spatiotemporal 4-D tensor train and ring unfolding [J]. IEEE Transactions on Geoscience and Remote Sensing2023611-22. [百度学术] 

31

Luo YLi XChen Set al. 4DST-BTMD: An infrared small target detection method based on 4D data-sphered space [J]. IEEE Transactions on Geoscience and Remote Sensing2024625000520. [百度学术] 

32

Li BXiao CWang Let al. Dense nested attention network for infrared small target detection [J]. IEEE Transactions on Image Processing2022321745-1758. [百度学术] 

33

Ying XLiu LWang Yet al. Mapping degeneration meets label evolution: Learning infrared small target detection with single point supervision [C]. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition202315528-15538. [百度学术] 

34

Wu SXiao CWang Let al. RepISD-Net: Learning efficient infrared small-target detection network via structural re-parameterization [J]. IEEE Transactions on Geoscience and Remote Sensing2023615622712. [百度学术] 

35

X. TianXie KZhang H. A low-rank tensor decomposition model with factors prior and total variation for impulsive noise removal [J]. IEEE Transactions on Image Processing2022314776-4789. [百度学术] 

36

Kang ZPeng CCheng Q. Robust PCA via nonconvex rank approximation [C]. IEEE Data Min. 2015211-220. [百度学术] 

37

Xie YGu SLiu Yet al. Weighted schatten p-norm minimization for image denoising and background subtraction [J]. IEEE Transactions on Image Processing20162510): 4842-4857. [百度学术] 

38

Sun XGuo LZhang Wet al. Small aerial target detection for airborne infrared detection systems using lightgbm and trajectory constraints [J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing2021149959-9973. [百度学术] 

39

Hui BSong ZFan Het al. A dataset for infrared image dim-small aircraft target detection and tracking under ground/air background [J]. Sci. Data Bank2019512): 4. [百度学术]