摘要
航空场景下的远红外图像迫切需要准确、鲁棒、快速的特征描述与自动配准方法。由于已有的多重线型描述符MLD特征存在“特征孤岛”和“尺度变换受限”的问题,因此针对远红外航空图像的配准问题,文章提出了一种聚合特征点以及线型描述符分段统计的特征描述方式,即sMLD特征。结合sMLD特征相互连接构成网状拓扑结构的特性,还提出了一种由粗到细的分支加速匹配算法RF-BA。其中,RF-BA粗匹配充分利用拓扑图的结构,通过局部寻优算法提高匹配的效率。RF-BA精匹配利用最小外接凸四边形原则和GMS校验原则,提升配准精度。实验结果表明,与已有的几种代表性配准方法相比,所提方法在配准精度和时间开销方面均具有更好的性能。
图像配准是对统一场景区域中由不同的时间、视角或传感器获得的多幅图像在几何上寻找对应关系的过程,它是实现图像的拼接、融合以及变化检测等工作的前提和基
目前基于特征的图像配准方法引起了学者们的广泛关注。例如,Low
与此同时,红外图像的配准研究近年来也取得了一些进展。例如Alam
1)传统的特征点描述主要是对特征点邻域信息进行统计,这通常需要设计额外的高复杂性算法来使描述子能够有效表达尺度和方向等信息。而将特征点连接为线段,提取线段上的有效信息能够生成线型描述符。不同于点特征,线特征本身即拥有准确的尺度和方向等信息。但MLD特征中存在“特征孤岛”和“尺度变换受限”的问题,为此本文提出了一种聚合特征点以及线型描述符分段统计的sMLD特征解决方案。
2)结合所提sMLD特征相互连接构成网状拓扑结构的特性,采用一种深度优先搜索,由粗到细的分支加速匹配方式RF-BA较好地实现了图像特征匹配。其中,RF-BA粗匹配充分利用拓扑图的结构,通过局部寻优算法提高匹配的效率;RF-BA精匹配则利用最小外接凸四边形原则和GMS校验原则,提升配准精度。
在航拍场景下,直升机的飞行高度通常为1~2 km,拍摄距离较远,同时为了不受时间和气候的限制,采用远红外相机,响应波段为8~14 μm,对应的红外线为长波。由于红外图像是通过测量物体的热辐射而成像的,因此相比于可见光图像来说,图像的分辨率较差,对比度和信噪比更低,视觉效果也更为模糊,在图像配准上难度也更大。长波红外与短波红外相比来说,由于短波红外利用目标反射环境中普遍存在的短波红外辐射,在分辨率和细节上更优,所以短波红外图像配准难度相对较低。同时,在远红外航空图像中,覆盖区域很广且拍摄角度会发生变化,因此图像的光线强度存在显著差异,还存在重复和稀疏结构,并且轮廓边缘较少,在特征匹配中存在许多异常,导致在配准上难度相对较大。
基于单目视觉的远红外航空图像配准不同于一般场景中的图像配准,飞机在高空中可能受气流影响,会产生颠簸,其位姿数据通常缺失。因此,航空图像的配准更加依赖算法精确性,需要一种高鲁棒性的算法。本文所提出的基于sMLD特征的远红外航空图像配准算法流程如

图1 远红外航拍图像配准算法流程图
Fig. 1 Registration algorithm flow chart of far infrared aerial images
MLD特征检测器检测到的特征点都会通过线段与多个特征点相连。相比于其他经典点特征,MLD特征具有更强的鲁棒

图2 MLD特征描述示意图
Fig. 2 The schematic diagram of MLD feature description
如
MLD模型为降低时间复杂度对线段长度进行了约束,设置了参数,其默认取值分别为128、256。通过合理设置参数范围,可有效减少描述符数量,但同时也会限制尺度不变性。此外,由于设置的,因此距离较近的特征点将无法构成MLD特征,这实际上不利于后续在较小的单元格中求取局部单应性矩阵,会损失精度。因此,本文提出一种改进的sMLD特征,主要是聚合特征点以及将线段分段,称之为sMLD特征(Segmented MLD)。相比于MLD特征仅保留在线长范围之内的特征,本文提出的sMLD特征主要有两处不同:
1)聚合特征点。为了抑制噪声干扰和增强描述子的鲁棒性,在生成描述符时,是取决于边长为a的图像块的总像素强度值,而a和线长L满足线性关系。如

图3 聚合特征点及端点与描述符关系示意图
Fig. 3 The schematic diagram of aggregated feature points and the relationship between endpoints and descriptors
2)长短线段。我们实际采集图像的分辨率为640480,将定义为最大的线长范围。线长范围的线型描述符称为“长线段”,用于匹配算法中跨越网格,搜索匹配点;线长范围的线型描述符称为“短线段”,可避免出现“特征孤岛”,其主要是用于匹配算法中进行网格内搜索,提升局部单应性矩阵的计算精度。在此基础上,所提算法将划分网格并求取各单元格的局部单应性矩阵。如果是利用MLD特征控制线长在的范围内,一方面不利于提高各个单元格的局部单应性矩阵的精度,另一方面“特征孤岛”会对后续的特征点剔除带来额外的时间开销。因此,sMLD特征描述方法则主要是针对后续匹配算法的需求所进行的改进。
sMLD算法需要提供全部特征点的位置信息,以及特征点数量、描述符维度和线性因子值。该算法通过循环遍历所有特征点,同时连接任意两个特征点之间的线段。但受输入的线长范围所约束,仅构建适当长度的线段并生成其线型特征描述符。具体来说,该算法首先通过欧氏距离计算任意两个特征点间线段的长度L。其次通过线性公式计算等分点所在局部图像块的边长a。然后进行条件判断,如果L满足,则聚合该对特征点。若L满足或者的条件,则等分得到个等分点,否则舍弃该线段。接着,利用给定积分图SI的右下角像素强度值减去左上角像素强度值,可以在常数时间复杂度内,获得以为近似中心的局部图像块的总像素强度值。在此基础上,比较相邻两图像块的总像素强度值大小,当时,相应的二进制位置为1,否则置为0。最后,将二进制串转化为整数形式,存入线型特征描述符中,同时保存满足线长范围的特征点存放位置、坐标信息和实际线长。
所提sMLD特征使用了两种线长度:大范围搜索的“长线段”,以及小范围搜索的“短线段”。最终会获得一个网状拓扑结构,实际上就是数据结构中的图,如
在GMS算
为实现RF-BA算法,需要从一对正确的匹配点对开始搜索。通过实验我们发现:在连续两张图像中响应值较大的特征点中,几乎一定能找到至少一对正确的匹配点。实际上从全部完成排序的sMLD特征点中,查找前(,N为特征点的总个数)个特征点,可以获得初始的一对正确匹配点。
sMLD算法得到的特征信息是按照图结构进行存储的,因此特征匹配无需穷举或者反复迭代,可以通过局部寻优算法来提高匹配的效率。由于sMLD的特征点两两相连形成一个线型描述符,因此每个特征点关联着常数数量的线型描述符,如
由此可见,粗匹配算法本质上是一个深度优先算法,我们称其为双图同步深度优先搜索。即采用深度优先搜索对两张图像进行粗匹配,获取“定位点”。如
具体来说,此算法首先将正确sMLD匹配点对的相关数据从集合中取出,包括描述符特征信息和长度,以及端点的信息。然后筛选两张图像中的“长线段”,并通过汉明距离对两张图像的“长线段”进行局部暴力匹配,获得的距离值(相似度)与端点的位置一起存入Open表中。接着将Open表中的数据按照距离排序。最后将阈值作为递归的结束条件,当距离小于阈值时进行递归,即以最小距离的一对线型描述符作为最优路径。当前sMLD匹配点在两张图中进行转移,线段另一端所对应的端点成为新的当前sMLD匹配点。通过此双图同步深度优先搜索,可找出所有的“定位点”。

图4 RF-BA粗匹配算法示例
Fig. 4 Example of RF-BA rough matching algorithm
(1) 首先对排序后的sMLD特征点中的前个特征点,采用穷举法找出第一对正确的sMLD匹配点对。虽是暴力匹配,但由于,假设每个特征点连接C个线性描述符,则该步骤的时间复杂度为。
(2) 如
(3) 与此同时,部分线型描述符(红色叉)不满足,无法实现跨域网格,因此同样被剔除。
(4) 剩下的端点则存入Open表,表示待深入搜索的匹配点。同时,根据最优路径(橙色实线),当前sMLD匹配点对转入与其对应的端点(橙色点)。
(5) 如
(6) 如
(7) 各层递归的结束条件为:Open表中没有待深入搜索的匹配点,此时会将当前的sMLD匹配点作为“定位点”存入相关集合中。
以上的DFS算法在搜索“定位点”时,会出现无效搜索,即重复地对同一对匹配点进行多次搜索。实际上只需要再添加一个哈希结构的Close表,即可将已经搜索过的匹配点排除,从而有效避免算法陷入死循环。RF-BA粗匹配利用“长线段”,可以跨越网格,避免陷入某一个单元格中,能有效降低局部相似结构误判断的概率。粗匹配获取的“定位点”,均匀分布于绝大部分单元格中,这也是精匹配中各单元格的初始sMLD匹配点对。
精匹配是对单元格进行精确搜索,它的作用是获取更为准确的局部单应性矩阵。所提精匹配算法的具体步骤如下:
(1) 如

图5 RF-BA精匹配寻优示意图
Fig. 5 The schematic diagram of RF-BA precise matching and optimization
(2) 对该点对在Image1和Image2中所关联的多个线型描述符的集合均计算汉明距离。选取相似度最高的一对描述符所在的线段作为最优路径,当前sMLD匹配点在两张图中进行转移,线段另一端所对应的端点(橙色点)成为新的当前sMLD匹配点。
(3) 算法在Image2中限制的网格数量为1×1,为确保位于网格边缘的特征点能正确匹配,将Image1中网格数量限制放宽到3×3,如
(4) 通过步骤(1)到(3),已找出正确的匹配点对,本步骤利用GMS校验原
(5) 对于被保留的单元格,四个匹配点(绿色点)的坐标决定了其最小外接凸四边形,因此用一个最小外接矩形将该凸四边形包围(绿色虚线框),其包含了所有匹配点,且该矩形面积在原图像面积中的占比越大,后续图像配准的精度则越高。此步骤即为最小外接凸四边形原则,保存这4个匹配点对用于后续计算单应性矩阵。
由此可见,RF-BA精匹配利用“短线段”,可以在单元格中进行精确搜索,能有效提高计算单应性矩阵的精度。精匹配的输出为各单元格是否被校验保留的标志,以及被保留单元格中最优的4个匹配点。
实验中我们主要从两个方面对所提算法进行性能评估: 1)RF-BA匹配算法的性能分析;2)各配准方法的性能对比分析。
在实验数据方面,实验中采用多组远红外图像数据集用于测试,

图6 远红外图像特征检测数据集
Fig. 6 Far infrared image feature detection data set
1) RF-BA匹配算法的时间复杂度和可靠性分析
sMLD特征描述算法生成的是64位的二进制线型描述符。在特征匹配过程中,通常二进制描述符是根据计算的汉明距离判断描述符是否匹配。而在计算机中,计算汉明距离仅需要进行异或操作与计数操作,此类硬件操作指令的运行效率高。假设共计N个特征点,每个sMLD特征点平均连接上C根线段,其中C是一个常数。因此,RF-BA算法在经过次对比,找出第一对正确匹配点的效率为,而后续双图同步深度优先搜索的寻优效率也是。因此,RF-BA算法的整体时间复杂度为。可见,相比于BF算法和迭代寻优的RANSAC方法,启发式的RF-BA算法匹配效率较高。
通过在

图7 概率密度分布与阈值影响曲线图,(a)匹配对相似度概率密度分布,(b)不同阈值对RF-BA算法的影响
Fig. 7 Probability density distribution and threshold influence curve,(a) matching pair similarity probability density distribution, (b) the influence of different thresholds on RF-BA algorithm
通过对
2) RF-BA算法加速效果分析

图8 各匹配算法召回率与运行时间对比柱状图,(a)召回率对比,(b) 运行时间对比
Fig. 8 Bar chart comparing the recall rate and runtime of each matching algorithm,(a) comparison of the recall rates, (b) comparison of the runtime
准确率-召回率曲线(P-R曲线)能够直观地反映不同方法在针对远红外图像数据集的特征提取性能。

图9 FAST结合sMLD算法与其他特征提取方法的P-R曲线对比图
Fig. 9 Comparison of P-R curves between FAST combined with sMLD algorithm and other feature extraction methods
从
2) RMSE与运行时间
为更为全面地对比所提方法与其他已有配准方法的性能优劣,对比了各配准算法对于远红外航空图像配准的效果以及运行时间。

图10 四组用于对比实验的远红外图像对
Fig. 10 Four sets of far infrared image pair for comparative experiments
实验中采用了RMSE(均方根误差)对各配准方法进行评估。RMSE能够反映特征点在经过透视变换前后的误差大小,其值越小意味着变换后的图像与参考图像的差异越小,证明配准效果越好。该指标的实验对比结果如

图11 RMSE与运行时间的对比结果图,(a) RMSE对比,(b) 运行时间对比
Fig. 11 Comparison of the RMSE and runtime results, (a) the RMSE Comparison, (b) the run-time comparison
从该图可以看出,在处理顺序图像序列中连续两张图像配准时,各种方法的RMSE值差距不大,说明各方法对于单独两张图像的配准准确率相差不大。虽然多数已有方法对两幅图像的配准可取得较好的效果,但却无法很好应对大量图像的配准问题,更无法有效解决大量远红外图像的序列配准问题。实验中我们发现:经典的图像匹配和对齐方法往往仅能实现图像的局部对齐,而很难获得精确的整体配准效果。究其原因是因为航拍场景下的远红外图像获取,主要采取让直升机由上往下逐列采集多组红外顺序图像序列的方式,这就造成单组顺序图像序列图片较多,在进行单列连续配准时就会导致图像特征的逐步消失。同时,多组顺序图像序列配准构成多列图像后,由于透视关系会导致相邻序列图像之间上下重叠率不一致,这也是多数已有方法难以实现多列整体配准的另一主要原因。因此,大量多列远红外航拍图像的配准更加依赖于算法的精确
本文方法利用所提sMLD特征,结合分支加速匹配算法RF-BA,可以有效地解决具有上述非一致重叠率的大量远红外航拍图像的配准问题。从
在方法运行时间方面,主要根据不同的检测器以及匹配算法之间的组合形式,分解为检测器、描述子、预匹配和匹配算法的分别耗时,在条形图中用不同颜色表示,并进行叠加便于统计和对比,实验结果如
基于
Method | Matching points | Error matching points | RMSE | Accuracy/% | Error matching rate /% | Runtime/s |
---|---|---|---|---|---|---|
SURF+BF | 36 | 14 | 11 | 61.1 | 38.9 | 2.034 |
SURF+RANSAC | 34 | 8 | 17 | 86.7 | 13.3 | 1.545 |
SURF+FLANN+RANSAC | 29 | 6 | 15 | 79.3 | 20.7 | 1.059 |
AKAZE+BF | 30 | 13 | 5 | 56.7 | 43.3 | 2.341 |
AKAZE+RANSAC | 27 | 6 | 13 | 77.8 | 22.2 | 1.756 |
AKAZE+FLANN+RANSAC | 25 | 6 | 7 | 76.0 | 24.0 | 1.473 |
FREAK+BF | 32 | 8 | 12 | 75.0 | 25.0 | 1.941 |
FREAK+RANSAC | 31 | 8 | 10 | 88.5 | 11.5 | 1.423 |
FREAK+FLANN+RANSAC | 26 | 6 | 8 | 87.0 | 13.0 | 0.868 |
ORB+GMS | 24 | 3 | 9 | 87.5 | 12.5 | 0.301 |
Ours(FAST+sMLD+RF-BA) | 18 | 1 | 3 | 94.4 | 5.6 | 0.563 |
本文针对远红外航空图像的配准问题,提出了聚合特征点以及线型描述符分段统计的sMLD特征。在此基础上,结合sMLD特征相互连接构成网状拓扑结构的特性,提出了一种由粗到细的分支加速匹配算法RF-BA。RF-BA算法在粗匹配阶段,主要利用拓扑图的结构,通过局部寻优算法提高匹配的效率。在精匹配阶段,主要利用最小外接凸四边形原则和GMS校验原则来提升配准精度。
实验结果表明:相比于已有的图像配准方法,sMLD特征对于远红外图像的配准具有更好的鲁棒性,特别是对几何变换的场景有更强的适应性。在处理具有非一致重叠率的大量远红外航拍图像拼接应用上本文方法的配准效果也更具优势,同时由于所提方法采用了RF-BA加速匹配方案,因而可在获得较高配准精度的同时,满足实际应用的运行效率需求。正是由于本文所提方法具有配准精确高、误差小、实时性强等优势,因此该方法可以应用于许多特殊的场景,例如城市全景图像、遥感图像和其他宽视野图像的配准拼接,对于军事以及其他行业都具有一定的理论和实践价值。
References
HUANG Hai-Bo, LI Xiao-Ling, Nie Xiang-Fei, et al. Research on remote sensing image registration based on SIFT algorithm [J]. Laser Journal, 2021, 42(6): 97-102. [百度学术]
黄海波, 李晓玲, 聂祥飞, 等. 基于SIFT算法的遥感图像配准研究[J]. 激光杂志, 2021, 42(6): 97-102. [百度学术]
Lowe D G. Object recognition from scale-invariant keypoints[C]// In Proceedings of the IEEE International Conference on Computer Vision (ICCV), 1999, pp. 1150-1157. [百度学术]
Bay H, Tuytelaars T, Van Gool L. Surf: Speeded up robust features[C]// In Proceedings of the European conference on computer vision. Springer, 2006, pp. 404-417. [百度学术]
Rublee E, Rabaud V, Konolige K, et al. ORB: An efficient alternative to SIFT or SURF[C]// In Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2011, pp. 2564-2571. [百度学术]
Rosten E, Drummond T. Machine learning for high-speed corner detection[C]// In Proceedings of the European conference on computer vision. Springer, 2006, pp. 430-443. [百度学术]
Calonder M, Lepetit V, Strecha C, et al. Brief: Binary robust independent elementary features[C]// In Proceedings of the European conference on computer vision. 2010, pp.778-792. [百度学术]
Leutenegger S, Chli M, Siegwart R. BRISK: Binary robust invariant scalable keypoints[C]// In Proceedings of the IEEE international conference on computer vision (ICCV). 2011, pp. 2548-2555. [百度学术]
Alahi A, Ortiz R, Vandergheynst P. Freak: Fast retina keypoint[C]// In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2012, pp. 510-517. [百度学术]
Saha S, Démoulin V. ALOHA: An efficient binary descriptor based on Haar features[C]// In Proceedings of the 19th IEEE International Conference on Image Processing. 2012, pp. 2345-2348. [百度学术]
Alcantarilla P F, Bartoli A, Davison A J. KAZE features[C]// In Proceedings of the European Conference on Computer Vision. 2012, pp. 214-227. [百度学术]
Alcantarilla P F, Nuevo J, Bartoli A. Fast Explicit Diffusion for Accelerated Features in Nonlinear Scale Spaces[C]// In Proceedings of the British Machine Vision Conference (BMVC), 2013, pp. 1-11 [百度学术]
Boyraz P, Bayraktar E. Analysis of feature detector and descriptor combinations with a localization experiment for various performance metrics[J]. Turkish Journal of Electrical Engineering & Computer Sciences, 2017, 25(3):2444-2454. [百度学术]
Bian J W, Lin W Y, Matsushita Y, et al. Gms: Grid-based motion statistics for fast, ultra-robust feature correspondence[C]// In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017, pp. 4181-4190. [百度学术]
Alam M S, Bognar J G, Hardie R C, et al. Infrared image registration and high-resolution reconstruction using multiple translationally shifted aliased video frames[J]. IEEE Transactions on Instrumentation and Measurement, 2000, 49(5): 915-923. [百度学术]
Wang Y H, Feng Y, Cao Y, et al. Application of grayscale nonuniformity correction in infrared image sequence mosaic[J]. Infrared. 2011, 32(9): 19-28. [百度学术]
Dong L, Fu D M, Yu X, et al. The study on infrared image mosaic application using immune memory clonal selection algorithm[C]// In Proceedings of the 10th World Congress on Intelligent Control and Automation, 2012, pp. 4831-4836. [百度学术]
YUAN Meng-Di. Research on infrared image stitching based on feature points [D]. Nanjing University of Science and Technology, 2013. [百度学术]
袁梦笛. 基于特征点的红外图像拼接研究[D]. 南京理工大学), 2013. [百度学术]
PEI Xia. Research on Infrared image registration and Mosaic Algorithm in Vehicle Motion Platform [D]. Xi'an University of Electronic Science and Technology, 2020. [百度学术]
裴夏. 车载运动平台中的红外图像配准与拼接算法研究[D]. 西安电子科技大学), 2020. [百度学术]
Shi J, Wang X. A local feature with multiple line descriptors and its speeded-up matching algorithm[J]. Computer Vision & Image Understanding, 2017, 162: 57-70. [百度学术]
Muja M., D G Lowe. Fast approximate nearest neighbors with automatic algorithm configuration[C]// In Proceedings of the VISAPP International Conference on Computer Vision Theory and Applications. 2009, pp. 331-340. [百度学术]
M A Fischler, RC. Bolles. Random Sample Consensus: A Paradigm for Model Fitting with Applications to Image Analysis and Automated Cartography[J]. Communications of the ACM, 1981, 24(6): 381-395. [百度学术]
GAO Yan, XIAO Xiao-Yue, Li Xiao-Hu, et al. Research on stitching method of massive aerial far infrared images with an inconsistent overlap rate [J]. Infrared and Laser Engineering. 2022, 51(7): 1-12.高琰, 肖小月, 李小虎, 等. 非一致重叠率大批量航拍远红外图像拼接方法研究. 红外与激光工程, 2022, 51(7): 1-12. [百度学术]