随着对海面小目标探测性能需求的日益高涨,研究有效的雷达海面目标检测方法具有重要的现实意义[1]。由于海杂波的非高斯、非线性、非平稳特征,海面弱目标在风浪等海洋环境因素作用下的不确定漂浮特性,以及海尖峰对弱目标形成的遮蔽现象等原因使得探测浮冰、潜艇潜望镜等海面漂浮小目标一直是雷达目标检测领域的难题[2-4]。
近年来,人们提出了多种基于特征的检测技术,以提高海杂波中小目标的检测性能[5-7]。文献[8]将海面弱目标的检测问题重构为三维特征空间中的单类异常检测问题,通过基于三特征检测的快速凸壳学习算法,从仅包含杂波观测的特征向量中学习杂波的决策区域。文献[9]将K 最近邻(K-Nearest Neighbor, KNN)算法和异常检测思想相结合,通过海杂波训练集在高维特征空间中的充分且遍历的超球面覆盖来确定决策区域,实现虚警可控的目标检测器设计。文献[10]将异常检测算法中的孤立森林(isolation Forest, iForest)算法引入到海面弱目标检测问题中,通过八维特征空间构建孤立森林进行异常检测判决,实现了可控虚警率下的浮动小目标检测。文献[11]利用目标与杂波的极化相干矩阵的特征值信息差异提出了一种基于极化联合特征值的雷达弱小目标检测方法,较基于特征值的检测方法有一定的性能提高。文献[12]综合考虑了全局和局部信息,提出一种融合孤立森林和局部离群因子(Local Outlier Factor, LOF)的离群点检测方法(FSIF-HDLOF),先利用iForest 对原始数据集进行剪枝,然后通过定义加权融合公式来确定离群点,利用LOF 进行更精确的检测。然而在不同海况下,海杂波各维度的特征以及重要性是不同的,现有的特征检测通常缺乏对复杂海况下的自适应性,从而限制了检测器泛化性能。此外,现有检测器大多计算复杂度较高,难以同时满足实时性和高准确需求,针对实际工程需求如何设计兼顾检测性能和计算效率的检测算法也成为了一大挑战。
本文针对不同海况下的海杂波特性进行了仿真分析和多特征提取,利用从时域、频域和时频域提取的9种特征构建差异性矩阵,设计了一种基于多特征联合的孤立森林雷达弱目标检测方法,融合改进的主成分分析(Principal Component Analysis, PCA)算法来解决iForest 算法处理高维数据的可行性。对于所提出的策略,通过IPIX 数据集验证其性能,并考虑了极化方式、虚警率、海况以及观测时长性能因素影响。
从数学角度我们可将雷达弱目标检测问题描述为一个二元假设检验问题,公式如下:
式中:H0为待测单元内不含目标的假设,H1为待测单元内含目标的假设;x(n)为雷达回波,t(n)为目标回波,c(n)为海杂波;N 为回波序列长度,R 为参考单元。
为了适应不同海况下的检测要求以及解决基于单一特征检测算法对海杂波和目标差异性刻画不足的问题,本文在原有相对平均幅度(Relative Average Amplitude, RAA)[8]、相对 多 普勒 向 量 熵(Relative Doppler Vector Entropy, RVE)、相对多普勒峰高(Relative Doppler Peak Height, RPH)[13]、相对多普勒变系数(Relative Doppler Coefficient of Variance, RCV)[10]、时频脊能量(Ridge Integration,RI)、连通域数目(Number of connected Regions,NR)和最大连通域大小(Maximum Size, MS)[14-15]7个特征的基础上,补充提出特征信息熵(Information Entropy, IE)、频域峰均比(Frequency domain Peak-to-Average Ratio, FPAR)组成9个特征。
图1 为HH 极化方式下,以2 级海况为例的海杂波和目标单元在不同特征中的概率分布直方对比图。图1(a)中目标单元RAA值普遍大于纯海杂波单元,目标单元的RAA 分布在0~5 之间,纯海杂波单元RAA 分布在0~2 之间;图1(b)中目标单元的IE 主要分布于数值7~11 之间,海杂波单元分布在数值4~9 之间;图1(c)目标单元的FPAR 主要集中在150 左右,而海杂波单元主要集中在60 左右;图1(d)海杂波的RVE 普遍分布在0.9~1.3 之间,而目标回波则主要分布在0.6~1.1 之间;图1(e)目标单元RPH 主要分布在0~8 之间,海杂波单元的RPH 主要在0~3 之间;图1(f)目标回波的RCV 分布在0.9~2.5 之间,而海杂波单元的RCV 则集中分布在数值0.4~1.2 之间;图1(g)中目标单元和海杂波单元的RI 分布完全分开;图1(h)和图1(i)中目标单元的NR 和MS 均仅有小部分重合。通过对比发现,上述9个特征中目标单元和海杂波单元均具有较好的区分度,可以体现海杂波与含目标回波在能量、几何方面的显著不同,同时彼此之间又存在着某种互补关系,因此上述特征可以作为分类和识别的有效特征。
图1 不同特征中目标和海杂波分布直方图
利用从多个域提取的9 个特征构造多维特征矩阵f:
式中:Fci 和Fti 分别为海杂波单元和目标单元的回波特征向量,大小为1 × p;p为特征个数,这里p = 9;K × R 为矩阵大小。则M 是一个大小S × p 的样本矩阵,这里S = K ×(R + 1)。由于iForest 适合处理大型数据且为了满足实际雷达检测任务中虚警率的需求,本文采用等间隔采样的方法以扩充数据集。
传统iForest算法的实现过程如图2所示,首先从原始数据中随机采样子集并选择子空间特征,随后基于所选取的子集和子空间特征递归构建孤立树(isolation Tree, iTree)合并成iForest,再沿着每棵iTree 的路径计算测试样本的路径长度,将所有iTree 上的平均路径长度作为样本的异常分数,最后根据异常分数和真实标签计算受试工作者特征曲线(Receiver Operating Characteristic, ROC)和曲线下面积(Area Under Curve, AUC)值来评估iForest算法在异常检测任务上的性能表现。
图2 iForest算法实现过程
iForest凭借其独特的机制和性能优势,保证了检测的鲁棒性,在海杂波背景下的雷达弱目标检测问题中展现出较强的适用性和潜力。
考虑到iForest 算法在处理高维数据时随机选择样本及特征构建iTree,导致特征信息漏用的问题,本文利用PCA 算法来融合杂波和目标回波特征。
PCA 算法[16]通过对原始数据集进行线性转换,按其所携带信息量的多少来选择主成分,将数据映射到新的坐标系中。在新坐标系下,每一个维度都代表了原始数据在特定方向上的投影,也反映了原始变量在维度上的信息比例。在PCA 处理中首先需要对原始数据进行标准化,标准化具有消除尺度影响、避免数值范围差异等优点,但也会丢失原始数据中的重要信息。标准化后各指标方差一致,导致提取的主成分仅能反映指标间相互影响,无法完整呈现原始数据的全貌。针对这一问题,本文在传统PCA 基础上引入了平均相关度,以评估主成分与原始特征的相关程度。
平均相关度的计算过程如下:
1) 对于每个主成分,使用皮尔逊相关系数计算它与所有原始特征之间的相关系数,来度量两个变量之间的线性关系强度。
2) 对于每个主成分,将其与所有原始特征的相关系数取绝对值,并计算平均值。
据此,对于第i 个主成分,假设有m 个原始特征,相关系数的计算公式为
式中:xj和yj分别为第j个样本在原始特征和第i个主成分上的取值;和
分别为原始特征和主成分的均值。对于相关系数的计算,样本之间的协方差矩阵和均值需要在PCA 之前进行中心化和标准化处理,以确保结果的准确性。
对于第i 个主成分,将其与所有m 个原始特征的相关系数取绝对值,并求平均值,即可计算出该主成分与原始特征之间的平均相关度(Average Correlation, AC):
式中,rij表示第i个主成分与第j个原始特征之间的相关系数。通过计算每个主成分的平均相关度,可以评估主成分与原始特征之间的整体相关性,并选择平均相关度超过某个阈值的主成分作为新的维度。
图3为相关系数矩阵的可视化分析,采用量化分类方法,可将特征间的相关系数按照其关联强弱程度划分为5 个独立的区间。在0~1 的绝对值范围内以0.2 为步长进行等距分割,从而形成无相关、弱相关、中等相关、强相关、极强相关5个区间。
图3 相关系数矩阵
从图3 可以看出,以特征9 为例,其与特征2、4和8 存在极强相关,与特征1、3、6 存在中等程度相关,与特征7 存在弱相关,与特征5 存在无相关。因此,可得时域、频域与时频域特征存在不同程度的相关性。通过消除高度相关特征,可有效减少信息冗余,同时降低后续高维空间处理的计算代价。相较于盲目地综合利用所有特征,这种有针对性的特征选择和融合更加科学合理,能够更好地满足复杂海杂波背景下的实际应用需求。
图4展示了改进PCA算法的具体流程图,包括基于PCA的数据降维和降维准则选择两部分。
图4 基于双参数加权的多特征联合算法流程图
在数据降维阶段,利用标准化处理后的特征数据计算协方差矩阵,得到特征值和特征向量。在降维准则选择阶段,在传统PCA 基础上引入平均相关度,形成双参数加权方法以评估主成分与原始特征的相关程度,从而构建投影矩阵。这种融合统计特性和相关分析的降维策略,能够在保留重要判别信息的同时,最大限度地避免标准化带来的信息损失。相比单纯依赖特征贡献率的特征选择,此处引入相关度约束兼顾了特征差异性和主成分代表性,有利于更准确刻画原始高维数据的内在结构。
本节设计了基于改进多特征联合的iForest 检测器,如图5 所示,该方法可分为数据预处理和多特征联合检测两部分。在数据预处理阶段,对海杂波数据进行特征提取并组合成高维特征矩阵;在多特征联合检测阶段,通过在原始PCA 算法中引入平均相关度这一概念,对特征矩阵进行降维处理,然后将其输入到孤立森林弱目标检测器中。最后,在给定虚警率下进行异常判决。
图5 改进多特征联合的iForest算法整体框图
本文以加拿大McMaster大学提供的1993年和1998 年IPIX 雷达的20 组实验数据为基础以验证所提出的优化算法的有效性和适用性。IPIX 雷达的载波频率为9.39 GHz,距离向采样率为10 MHz,对应的采样距离间隔为15 m。IPIX雷达的1993年数据以1 000 Hz的采样率持续运行131.072 s,以获取131 072 个数据点。1998 年数据中每个数据集由28 个相邻距离单元(持续运行60 s)的60 000 个相干脉冲序列组成。其中第19 和第20 数据集的距离分辨率分别为15 m和9 m,其余数据集的范围分辨率为30 m。在传输和接收阶段,IPIX 雷达采用水平(H)和垂直(V)两种极化方式,从而获取4种不同的极化组合数据,分别为HH、HV、VH 和VV。
由于高维特征空间中,两类样本之间的分离程度难以直观评估,因此引入了B 距离(Bhattacharyya Distance)作为量化指标来评估不同特征组合在高维特征空间中的可分性。定义海杂波和目标样本的特征向量集合为
定义海杂波和目标样本的数学期望和协方差分别为
据此定义海杂波和目标样本集合S0 和S1 的B距离为
图6 为观测时间为512 ms 下前10 组数据以B距离为指标利用PCA 以及改进后PCA 对九特征联合特征向量和七特征联合特征向量进行降维后的特征可分性分析,可以得到:1)本文所提九特征联合的方法展现出良好的样本区分能力,明显优于七特征联合。其中,VV极化方式下的B距离最低,两组交叉极化的B距离较为相近,在多极化条件下均展现出良好的样本区分能力。2)本文所提的双参数加权的PCA 算法相比于原始基于特征贡献率的PCA 算法对数据进行降维处理后B 距离更大,表明其选取的维度能够更为有效地平衡数据的降维效果和信息的保留程度。
图6 多特征联合特征向量的平均B距离图
表1给出了在观测时间为512 ms、虚警率设置为10-3下,使用IPIX 数据集中20组数据4个极化通道的回波序列测试多类检测器的检测性能,包括分形检测器[17]、三特征检测器[8]、iForest 检测器、LOF 检测器[12]、PCA 检测器以及本文所提检测器。相比于传统的检测器,本文所提方法检测性能提升明显,平均检测性能分别提升了0.585 7和0.338 9。较之原始iForest 和LOF 检测算法也有不错的表现,尤其是在VV 极化模式下,平均检测性能分别提升了5.87%和5.06%。对比仅使用特征贡献率的PCA检测器也有1%~2%的性能提升。
表1 模型性能对比
检测器类别分形检测器三特征检测器iForest检测器LOF检测器PCA检测器本文所提HH 0.358 0 0.592 4 0.873 7 0.881 3 0.922 3 0.944 6 HV 0.404 2 0.626 1 0.913 5 0.923 2 0.952 7 0.967 5 VH 0.384 3 0.644 5 0.921 5 0.930 4 0.961 8 0.973 4 VV 0.332 6 0.603 4 0.878 4 0.884 5 0.919 9 0.936 3平均0.369 8 0.616 6 0.896 8 0.904 9 0.939 2 0.955 5
可以发现,同一组数据集在不同极化方式下的检测概率差距很大。出现这一结果的原因在于平均信杂比(Average Signal to Clutter Ratio, ASCR)的不同,它直接影响着雷达系统对目标的探测能力。
图7 为20 组数据集的ASCR,可以看出不同数据集及极化模式下,目标回波平均信杂比差异显著。其中,VV 模式下的ASCR 最低,说明该模式下目标与海杂波的差异性较弱。两种交叉极化方式的ASCR 是4 种极化方式中最接近的,因此二者检测结果也较为接近,且在大部分数据集下平均信杂比高于其他极化方式,说明交叉极化方式在检测时更易捕捉到目标。
图7 不同极化方式下的ASCR
图8为iForest检测器、基于特征贡献率的多特征联合iForest 检测器以及本文所提双参数加权的多特征联合iForest 检测器在观测时长512 ms、虚警率10-3下的检测性能。可以发现,在4 种极化方式下,引入PCA 算法后的iForest 检测器的检测性能均优于原始iForest 检测器。以HH 极化为例,引入PCA 算法后的iForest 检测器在2、3、17、18 和19号数据集上检测性能提升最为明显。在其他数据集上也有较为不错的检测性能。其次,本文所提出的改进多特征联合的孤立森林弱目标检测方法,在部分数据集上取得显著的检测性能提升。以HH极化为例,所提检测器在3、17和18号数据文件上,对比原始算法分别提升了11.94%、14.82%和12.11%。同样地,较之基于特征贡献率的PCA 算法,也有1.51%、2.93%和3.42%的检测性能提升。
图8 不同降维准则下4种极化的平均检测性能
图9 为应用不同降维准则的上述3 种检测方法在4 种极化方式下的ROC 曲线,从极化方式角度评估了检测性能,并将虚警概率与极化方式综合考虑,对比分析在低虚警概率时的检测性能以及在不同数据极化方式时的泛化性能。
图9 4种极化方式下检测器的ROC曲线图
从图9 可以观察到,在4 种不同的极化方式下,与原始的iForest 算法相比,采用PCA 算法对数据进行降维处理后,系统检测性能显著增强,特别是在低虚警率的情况下,性能提升尤为突出。这意味着本文所提检测器能保持数据特征之间的相关性。然而,需要注意的是,随着虚警率的增加,3种检测器的性能差距有逐渐减小的趋势,由此表明基于改进多特征联合的孤立森林弱目标检测方法可以显著提高检测精度。
在实际探测任务中,风速、温度和天气等环境因素会导致雷达工作环境复杂多变。因此,检测方法需要适应不同探测环境下获取的数据。此外,在实际的雷达弱目标检测工程中,雷达需要快速获取海面信息,这就要求缩短观测时长。而观测时长的长短直接影响到雷达动态获取信息的能力,且不同观测时长获取的信息量也会有所差异。通常需要在信息获取速率和检测精度之间进行权衡,过短的观测时长可能会限制检测器获取到的信息,从而影响检测性能。因此,图10、图11 分别通过实验测试验证了所提探测器在不同海况、不同观测时间下的探测性能。
图10 不同海况下的检测概率
图11 不同观测持续时间下的检测概率
图10 选用IPIX 数据集中代表2、3 和4 级海况的#30、#280 和#17 号数据文件数据进行仿真分析以验证海况对检测概率的影响。可以得到本文所提方法取得了较好的检测性能,尤其是在4种极化方式的低海况下,相比于原始iForest 算法检测性能提升显著。在3级海况下,本文所提方法检测准确率达到最高,在多种极化方式下,检测概率均可以达到0.95 以上。相比之下,在2 级海况下,检测概率最低。这是由于iForest 算法本身对局部异常点敏感性不高,加之在低海况下弱目标回波和海杂波容易产生频谱混叠,进而导致检测性能较低。在高海况下,iForest算法可通过多特征联合在一定程度上减少此问题。而4级海况时,海杂波的后向电磁散射特性较强,海面的浪、涌所造成的海尖峰与目标回波相似且幅度较高,容易掩盖目标,此时检测概率略有所降低。
图11 显示了极化方式为HH 时,iForest 检测器、基于特征贡献率的iForest 检测器、基于平均相关度的iForest 检测器以及基于平均相关度与特征贡献率双参数加权的iForest 检测器在不同观测时长下的检测性能对比。结果表明,随着观测时长的增加检测概率显著提高,当观测时长为4 096 ms时,检测概率最高。当观测时长由2 048 ms增加至4 096 ms 时,检测概率略微提升,说明此时观测时长的增加给检测器检测性能带来的提升已经接近饱和。本文所提检测器,在观测时长超过256 ms,均能达到85%以上的检测概率,且优于其他3种检测器,这充分体现了所提方法在高精度、低时长等方面的优异性。
本文针对现有海杂波背景下雷达弱目标检测方法的不足,研究了异常检测思想在解决海杂波背景下雷达目标检测问题上的应用。首先从时域、频域等多个维度分别提取9个海杂波和目标之间的差异特征,从而将雷达回波序列映射到特征空间;其次提出基于改进多特征联合的孤立森林弱目标检测方法,融合PCA 算法设计了结合平均相关性的双参数降维方法,该方法在PCA 算法的基础上进行了改进,不仅比单纯基于特征贡献度的策略更为科学和合理,而且更有效地满足了复杂海杂波环境中雷达对弱目标的检测需求,具有容错率高、抗干扰能力强的优点。在低虚警概率10-3下,本文所提检测方法比PCA检测方法和iForest检测方法分别提升了5.87%和1.63%。
[1] CHEN Yaqing, SHEN Shijian,LEI Zhiyong.Small Target Detection on Sea Surface Based on Feature-Weighted Support Vector Machine[C]//2023 8th International Conference on Signal and Image Processing, Wuxi, China:IEEE,2023:156-160.
[2] PEI Jifang, YANG Yu, WU Zebiao, et al.A Sea Clutter Suppression Method Based on Machine Learning Approach for Marine Surveillance Radar [J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2022, 15:3120-3130.
[3] 董云龙,张兆祥,丁昊,等.基于三特征预测的海杂波中小目标检测方法[J].雷达学报,2023,12(4):762-775.
[4] 关键,伍僖杰,丁昊,等.基于三维凹包学习算法的海面小目标检测方法[J].电子与信息学报,2023,45(5):1602-1610.
[5] XU Shuwen, ZHENG Jibin, PU Jia, et al.Sea-Surface Floating Small Target Detection Based on Polarization Features[J].IEEE Geoscience and Remote Sensing Letters, 2018, 15:1505-1509.
[6] ZHAO Wenjing, JIN Minglu, CUI Guolong, et al.Eigenvalues-Based Detector Design for Radar Small Floating Target Detection in Sea Clutter[J].IEEE Geoscience and Remote Sensing Letters, 2022, 19:1-5.
[7] XIE Jianda, XU Xiaojian.Phase-Feature-Based Detection of Small Targets in Sea Clutter[J].IEEE Geoscience and Remote Sensing Letters, 2021, 18:1-5.
[8] SHUI Penglang, LI Dongchen, XU Shuwen.Tri-Feature-Based Detection of Floating Small Targets in Sea Clutter[J].IEEE Trans on Aerospace and Electronic Systems,2014, 50(2):1416-1430.
[9] GUO Zixun, SHUI Penglang.Anomaly Based Sea-Surface Small Target Detection Using K-Nearest Neighbor Classification[J].IEEE Trans on Aerospace and Electronic Systems, 2020, 56(6):4947-4964.
[10] XU Shuwen, ZHU Jianan, JIANG Junzheng, et al.Sea-Surface Floating Small Target Detection by Multifeature Detector Based on Isolation Forest[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021,14:704-715.
[11] 王威,杨勇,韩静雯.基于极化联合特征值的雷达弱小目标检测方法[J].雷达科学与技术,2024,22(1):57-62.
[12] 凌莉,程张玉,邹承明.融合孤立森林和局部离群因子的离群点检测方法[J].计算机应用与软件,2022,39(12):278-283.
[13] SHI Sainan, SHUI Penglang.Sea-Surface Floating Small Target Detection by One-Class Classifier in Time-Frequency Feature Space[J].IEEE Trans on Geoscience and Remote Sensing, 2018, 56(11):6395-6411.
[14] 索莲.强海杂波背景下的海面目标检测[D].北京:中国电子科技集团公司电子科学研究院,2021.
[15] 唐建军.强海杂波中海面小目标检测算法研究[D].北京:中国电子科技集团公司电子科学研究院,2022.
[16] SAHA B N,RAY N,ZHANG Hong.Snake Validation: a PCA-Based Outlier Detection Method[J].IEEE Signal Processing Letters, 2009, 16(6):549-552.
[17] LI Dongchen, SHUI Penglang.Floating Small Target Detection in Sea Clutter via Normalised Hurst Exponent[J].Electronics Letters, 2014, 50(17):1240-1242.
Detection Method of Sea Surface Small Target Based on Improved Isolation Forest
李雨笑 女,硕士研究生,主要研究方向为海杂波背景下雷达弱目标检测。
胡居荣 女,博士,教授,主要研究方向为信号处理。
邢延潇 男,硕士研究生,主要研究方向为雷达目标检测。
戴天石 男,硕士研究生,主要研究方向为雷达目标检测。
张伟杰 男,硕士研究生,主要研究方向为雷达目标检测。