雷达目标的HRRP 表示目标散射中心在雷达-目标方向上的投影,反映目标各散射中心之间的径向位置关系,包含了尺寸、目标结构和形状等目标结构特征,HRRP 包含的丰富目标细节信息为目标识别提供了可能,由于易获取,易存储和易处理的特点,目前已广泛应用于雷达目标识别领域[1-3]。
目前传统的HRRP 雷达目标识别方法主要包括支持向量机(Support Vector Machine,SVM)和隐马尔可夫模型(Hidden Markov Model, HMM)[4-6],传统方法识别精度有限,主要基于浅层结构特征,容易造成信息丢失,近年来深度学习识别算法在HRRP 目标识别领域广泛应用,HRRP 为时序性数据,通过深度学习方法可进行更有效的特征提取和自动识别,提升了目标识别的准确性和可靠性。目前基于深度学习的HRRP 目标识别方法主要有以下几类:基于卷积神经网络(Convolutional Neural Network,CNN)的HRRP 目标识别,Fu 等人提出一种卷积模块和残差模块相结合的高效可扩展神经网络模型[7];基于循环神经网络(Recurrent Neural Network, RNN)的HRRP 目标识别,徐彬等人提出了基于乘性循环神经网络模型,该方法考虑了时序相关性,并采用投票策略融合信息,获得输出目标类别[8],张一凡等人提出基于注意力机制的堆叠LSTM(Long Short-Term Memory)网络模型,该方法实现了更深层次抽象特征提取,通过引入注意力机制来提高隐藏层特征的非线性表达能力[9];刘家麒等人提出基于注意力和双向GRU 网络模型,该方法利用了双向的时序信息,并通过注意力机制使模型能够自动关注并计算出对识别有效的目标区域部分[10];基于Transformer 的HRRP 目标识别,Wang 等人在BERT 模块的基础上引入卷积模块取代传统的时域分割方法,通过CNN-BERT 网络进行特征提取,能够有效捕捉局部特征和全局特征[11]。
本文提出了一种基于融合网络的HRRP 目标识别方法,由输入、数据预处理、BERT 初步特征提取、并行网络深度特征提取和输出层构成。模型中采用MCNN 可以捕捉HRRP 序列不同尺度的特征,解决了单一尺度遗漏某些重要特征的问题,与SE 模块结合使网络能够更加关注重要的特征信息。与卷积并行排布的BiGRU 和多头注意力机制能够捕捉HRRP 序列中的长期依赖关系和不同位置间的相关性,丰富了模型的表达能力,使其能够捕捉HRRP 序列中更加全面的特征。最后对各分支提取的特征进行融合,综合利用HRRP序列中多种特征信息,最大程度地利用各个模块的优势,弥补其他模块的不足,提供更全面、更准确的特征表示,从而提升模型的分类识别性能。
本文提出的基于融合网络的HRRP 目标识别方法模型架构如图1所示,识别流程如下步骤所示:
图1 基于HRRP识别的融合模型结构示意图
步骤1: 首先对输入数据进行预处理;
步骤2: 使用BERT进行初步特征提取;
步骤3: 使用并行网络进行深度特征提取,并行网络左侧分支由MCNN 模块和SE 模块组成,右侧分支由BiGRU模块和多头注意力模块组成;
步骤4: 将提取到的特征进行特征融合和分类识别。
模型通过使用BERT 模块进行初步特征提取,BERT是一个双向编码模型,结构图如图2所示,最底层为输入层,中间两层为编码层,每个编码层由多头自注意力模块和前向连接模块组成,最上层为输出层[12]。
图2 BERT结构示意图
首先,在输入层处理序列数据时,需要考虑数据的位置信息,因此在模型中引入位置编码,以捕捉序列中元素的相对位置,位置编码利用正弦和余弦函数的非线性变换分别对特征序列的奇数位和偶数位进行位置编码,计算公式如下:
式中,PE 表示位置编码,pos表示位置信息,dmodel表示输入序列的向量维度。
在编码层中,通过softmax 函数获得V 的注意力权重,计算公式如下:
式中,Q为查询矩阵、K为查询键值矩阵和V为值矩阵,是对位置编码后输出的HRRP特征序列分别进行全连接变换得到的是缩放因子。多头注意力将注意力机制扩展到h个平行的头,每个头独立进行注意力计算,最后将各个头的输出进行拼接,再通过一个全连接变换得到最终的输出,计算公式如下:
每个头的输出可以表示为
通过前向连接模块进一步增强模型的表达能力,该模块将HRRP 的分布式特征映射到高维空间,再映射回低维,进一步保留有用的特征信息,前向连接模块输出公式如下:
式中,W1、W2、b1、b2 分别表示两次线性变换的权重矩阵和偏置,max代表了ReLU激活函数。
模型通过使用MCNN 模块提取HRRP 中的局部结构特征,MCNN能够通过不同尺度的卷积核来获取不同大小的感受野,从而关注HRRP中不同的局部特征结构,提取更加丰富的多层次特征[13],并且每个多尺度模块中引入残差网络,有效地解决了网络中存在的梯度爆炸、梯度消失和网络退化问题,提高了模型的性能[14],多尺度残差卷积模块结构图如图3所示。
图3 多尺度残差卷积模块示意图
本文将ResNet18 转换为一维卷积形式,采用前12 层卷积层,其中1×3 卷积核的残差卷积模块结构如图4所示,conv表示卷积。
图4 残差卷积模块示意图
在卷积模块之后,模型加入了SE模块,通过该模块能够自适应地调整特征通道的权重通过全局信息,使得网络能够更加关注重要的特征信息,从而提高模型判别力[15-16]。SE 模块的实现步骤如图5所示。
图5 SE模块示意图
首先计算得到卷积输出的特征Fcb中各通道的平均值,并将其排列为向量xsq =[ xsq(1),…, xsq(S) ],向量xsq(i)可以表示为
Fcb(i,n)代表特征Fcb 的第i 个通道中的第n 个元素,特征Fcb 每个通道所拥有的参数量用N 表示。然后特征经过两层全连接层,输出计算公式如下:
WFCi和bi分别是第i个FC 层的权重矩阵和偏置项,在第一次全连接中,输入xFCi - 1 作为xsq,两次全连接中激活函数f(·)分别为ReLU 函数和Sigmoid 函数[17]。最终输出计算公式如下:
本文采用了BiGRU 模块捕捉序列中的长期依赖关系,GRU 结构简单,参数量少,有效提升了训练速度,同时BiGRU 可以提取被单向GRU 忽略的特征信息[18],BiGRU模块的实现步骤如图6所示。
图6 BiGRU模块示意图
假设t 时刻节点的输出状态为ht ,则先前输出状态为ht -1,候选状态,则有
其中,zt是更新门,控制前一时刻ht - 1对当前时刻ht的影响,zt的计算公式如下:
其中,xt 为输入数据,σ 表示Sigmoid 激活函数,Wz和Uz 分别是更新门zt 的权重矩阵。候选状态计算公式如下:
其中,W 和U 是GRU 的权重矩阵,r表示重置门,⊙表示逐个元素进行相乘。当更新门趋近于0时,当前状态的更新值仅与xt相关,而与之前状态没有任何联系。重置门rt表示公式如下:
其中,Wr和Ur分别表示xt和ht - 1的权重。
在BiGRU 模块之后加入批标准化处理可以优化网络输出的结果,同时结合多头注意力模块可以更好地捕捉不同位置间的相关性,多头注意力的计算过程如公式(2)所示,最后将提取到的特征进行特征融合并通过softmax层对特征进行分类识别。
本文采用3d Max 建立6 个舰船模型,利用FEKO 进行计算,得到舰船目标的HRRP 数据,FEKO 软件中的仿真参数:带宽为80 MHz,雷达中心频率为10 GHz,频率采样点数为200 个,收发极化均采用垂直极化,其中方位角范围为0°~360°,间隔1°,俯仰角为80°,每个距离单元对应长度为1.875 m,其中油船仿真模型示意图如图7(a)所示,图7(b)为油船数据扩充前幅值归一化后的HRRP图。
图7 舰船模型与HRRP示意图
6 类舰船典型角度HRRP 数据示意图如图8所示。
图8 HRRP样本数据示意图
从图8可以看出,样本的HRRP 分布范围、强散射点个数等特征具有明显区别,这为舰船类型的后续识别提供了一定的基础。
仿真数据集中各舰船分别得到360 个有效HRRP 数据样本,这些数据对基于深度学习的HRRP 目标识别而言,样本数量远远不够,为了更贴合实际应用场景和实验训练,同时保持HRRP样本数据的多样性,采用以下两种方法扩充数据集[7]:
方法一:根据HRRP 平移敏感性,对HRRP 数据进行平移截取,将数据分别左右平移20 个距离单元和40 个距离单元,原始数据扩充为原来的5倍。
方法二:考虑噪声因素影响,在平移得到的HRRP 数据中加入随机噪声,为更好模拟真实环境,分别对HRRP 数据添加信噪比分别为1、3、5、7、10的高斯白噪声。
此时,单一舰船目标的HRRP 数据由360 个,变为9 000 个,最后对扩充的数据集按照每类目标8∶2的比例划分为训练集和测试集。
2.2.1 不同算法识别效果对比
为验证本文提出的融合识别网络在雷达HRRP 目标识别任务中的有效性,本文通过常用的HRRP 目标识别模型SVM,去噪卷积神经网络(Denoising Convolutional Neural Network,DnCNN)[19],目标感知二维循环神经网络(Target Aware Two-Dimensional Recurrent Neural Network, TATDRNN)[20],LSTM[21],CNN-BERT[11]对每类舰船的识别准确率和加权准确率进行对比分析,各模型对HRRP目标识别结果如表1所示。由表1结果可以看出,传统机器学习方法SVM 识别准确率相较于深度学习方法识别准确率较低,因此深度学习方法具有较好的特征提取分类能力,其中DnCNN 与LSTM 识别性能相差较小,CNN-BERT 在各模型中表现优异,识别准确率可达93.53%,本文所提模型与其他模型相比,在各个方面均有较好的表现,识别准确率最高可达到95.88%,相较于CNN-BERT提高2.35%,因此本文模型能够更加有效利用HRRP序列信息,具有较好的识别性能。
表1 识别结果对比 %
模型SVM DnCNN TATDRNN LSTM CNN-BERT本文模型CST 83.28 91.67 93.61 89.89 94.56 95.67 YOU 84.17 84.78 90.94 89.78 93.89 94.83 TUO 85.11 90.67 91.28 87.78 93.33 94.61 LCS 95.78 96.94 93.67 93.36 94.33 98.58 DDG104 82.61 89.39 90.94 91.39 91.83 95.17 CVN-65 85.67 87.72 92.94 92.67 93.22 96.44精确率86.33 90.19 92.24 90.92 93.55 95.90召回率86.10 90.19 92.24 90.81 93.53 95.88 F1分数86.08 90.16 92.24 90.83 93.53 95.88准确率86.10 90.19 92.24 90.81 93.53 95.88
2.2.2 不同训练样本大小的识别结果对比
在实际中重点关注的目标大都是非合作目标,获取多姿态角域的HRRP 数据难度较大,采集数据数量较少,因此经常会遇到小样本学习问题,在小样本条件下仍然能保持良好性能的模型才是一个好的识别模型。针对小样本条件下的HRRP目标识别问题,本文对所提模型进行小样本敏感性分析。设置样本总数分别为原样本的12.5%,25%,50%,75%,100%,训练集与测试集比例始终保持8∶2。
实验结果如图9所示。从图9可以看出,随着训练样本的减少,所有识别方法的准确率都有所下降,本文所提模型在样本数量不断变化情况下的识别性能均表现最优,即使在样本数量仅占总数量12.5%的情况下,识别准确率也达到80%以上,证明了本模型的稳健性,同时,模型在不同规模的样本上均有优异的表现,包括精确率、召回率、F1 分数和准确率,显示出模型较好的性能扩展性。
图9 各方法在不同训练样本下的识别准确率
2.2.3 消融实验
上述对比实验充分证明了本文模型在HRRP目标识别方面的有效性,为了验证模型中每个模块的有效性,本文以BERT 作为基线方法,通过对BERT 添加各个模块来进行消融实验,实验结果如表2所示。仅使用BERT 时,识别准确率为85.86%,当添加MCNN 模块和SE 模块后,识别准确率提高了8.31%,说明所添加模块可以有效提取数据中的深度特征信息,通过添加GRU 或BiGRU,相较于基线BERT 识别准确率有所上升,说明对特征提取存在效果,其中BiGRU 的效果更好,但仍需要与别的模块进行配合,将BERT、MCNN、SE与Bi-GRU相加,识别准确率相较于BERT与卷积相加时识别准确率提升至95.06%,再加上多头注意力,可得到完整模型,此时识别准确率最高为95.88%。以上实验表明,本文所提模块可以实现有效融合,有效地增强对目标的识别性能。
表2 消融实验结果对比
模型ⅠⅡⅢⅣⅤ本文模型BERTMCNN√ √ √ √ √ √√ √ √SE√√ √GRU√BiGRU√ √ √多头注意力√准确率/%85.86 94.17 86.37 87.68 95.06 95.88
2.2.4 特征分布可视化
为了对HRRP 样本在模型处理后的特征空间分布情况进行更直观的分析,本文利用t-SNE 将模型在全连接层的输出进行降维处理[22],图10为分布可视化特征图,图中每个点代表一个测试样本,每种颜色代表一种舰船类别,共六类,从图中可以看出,模型对不同类别所提取特征区分良好,验证了本文所提模型能够有效地划分不同类别,并且在数据样本之间展现出了出色的聚类效果。混淆矩阵可以看出识别性能均衡,图11为本文所提模型的混淆矩阵,由混淆矩阵可以看出模型的识别性能相对均衡,因此本文所提模型具有一定的稳健性。
图10 可视化特征图
图11 模型混淆矩阵图
本文提出了一种基于融合网络的HRRP 目标识别方法,主要将BERT、MCNN、BiGRU、SE 注意力和多头注意力进行有效融合,有效地提取了HRRP 的深度特征信息。首先采用BERT 进行初步特征提取,然后通过并行网络提取深度特征,MCNN 可以更好地关注HRRP 中不同的局部特征结构,提取更为丰富的多层次特征,SE模块可以对MCNN提取到的特征进行优化,更好地关注数据中的关键信息,BiGRU 和多头注意力结合能够更好地处理各特征维度间的长期依赖关系和捕捉不同位置间的相关性,获得丰富的特征表示,最后对结果进行拼接,最大程度地利用不同网络的优势,提升模型的分类性能。实验结果表明,本文所提方法在多种对比方法中表现突出,具有较好的稳定性和识别性能。
虽然本文所提模型在HRRP 目标识别方面具有较好的识别性能,但模型存在一些限制,在现有模型中,BERT 模块参数较多,且与其他模块叠加后,参数数量进一步增加,对实验环境的配置需求较大。因此,后续需要对模型进行轻量化处理,以优化性能和资源利用效率。同时,也可在其他序列识别领域中参考本文所提方法,但要综合考虑数据适应性、结构通用性,以及性能和效率等多方面因素。
[1] HUANG Yue, WEN Yi, SHI Liangchao, et al. Recognition-Aware HRRP Generation with Generative Adversarial Network[J]. IEEE Geoscience and Remote Sensing Letters,2021, 19:1-5.
[2] WU Lingang, HU Shengliang, XU Jianghu, et al. Ship HRRP Target Recognition Against Decoy Jamming Based on CNN-BiLSTM-SE Model[J]. IET Radar, Sonar & Navigation, 2024, 18(2):361-378.
[3] 付哲泉,李尚生,李相平,等.基于高效可扩展改进残差结构神经网络的舰船目标识别技术[J].电子与信息学报,2020,42(12):3005-3012.
[4] WANG Xiaodan, WANG Jinqin. Support Vector Machine for HRRP Classification[C]//Seventh International Symposium on Signal Processing and Its Applications, Paris,France:IEEE, 2003:337-340.
[5] SHEN Kejia, PARVIN H, QASEM S N, et al. A Classification Model Based on Svm and Fuzzy Rough Set for Network Intrusion Detection[J]. Journal of Intelligent &Fuzzy Systems, 2020, 39(5):6801-6817.
[6] 但波,姜永华,李敬军,等.基于空时融合隐马尔科夫模型的舰艇编队目标识别方法[J].电子与信息学报,2015,37(4):926-932.
[7] FU Zhequan, LI Shangsheng, LI Xiangping, et al. A Neural Network with Convolutional Module and Residual Structure for Radar Target Recognition Based on High-Resolution Range Profile[J]. Sensors, 2020, 20(3):586.
[8] 徐彬,张永顺,张秦,等.采用乘性RNN的雷达HRRP目标识别[J].西安电子科技大学学报,2021,48(2):49-54.
[9] 张一凡,张双辉,刘永祥,等.基于注意力机制的堆叠LSTM 网络雷达HRRP序列目标识别方法[J].系统工程与电子技术,2021,43(10):2775-2781.
[10] 刘家麒,陈渤,介茜.基于注意力机制和双向GRU 模型的雷达HRRP 目标识别[J].雷达学报,2019,8(5):589-597.
[11] WANG Penhui, CHEN Ting, DING Jun, et al. Intelligent Radar HRRP Target Recognition Based on CNN-BERT Model[J]. EURASIP Journal on Advances in Signal Processing, 2022(1):1-26.
[12] VASWANI A, SHAZEER N, PARMAR N, et al. Attention is All You Need[C]//the 31st International Conference on Neural Information Processing Systems, Long Beach, CA, USA:Curran Associates Inc, 2017:6000-6008.
[13] 王彩云,胡允侃,李晓飞,等.基于卷积稀疏编码与多分类器融合的雷达HRRP目标识别方法[J].系统工程与电子技术,2018,40(11):2433-2437.
[14] GUO Chen, HE You, WANG Haipeng, et al. Radar HRRP Target Recognition Based on Deep One-Dimensional Residual-Inception Network[J]. IEEE Access,2019, 7:9191-9204.
[15] HU Jie, SHEN Li, SUN Gang. Squeeze-and-Excitation Networks[C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT,USA:IEEE, 2018:7132-7141.
[16] 刘世琦,匡华星,杨昊成.基于CFAR-CNN 的轻量级海上目标检测[J].雷达科学与技术,2024,22(3):312-320.
[17] NAIR V, HINTON G E. Rectified Linear Units Improve Restricted Boltzmann Machines[C]// the 27th International Conference on Machine Learning, Haifa, Israel:[s.n.], 2010:807-814.
[18] CHUNG J, GULCEHRE C, CHO K H, et al. Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling[J].Arxiv,2014. https://arxiv.org/abs/1412.3555.
[19] 王哲昊,简涛,王海鹏,等.基于DnCNN 的海面目标一维距离像识别方法[J].信号处理,2021,37(6):932-940.
[20] LIU Jiaqi, CHEN Bo, CHEN Wenchao, et al. Radar HRRP Target Recognition with Target Aware Two-Dimensional Recurrent Neural Network[C]//2019 IEEE International Conference on Signal Processing, Communications and Computing, Dalian, China: IEEE, 2019:1-6.
[21] JITHESH V, SAGAYARAJ M J, SRINIVASA K G.LSTM Recurrent Neural Networks for High Resolution Range Profile Based Radar Target Classification[C]//2017 3rd International Conference on Computational Intelligence & Communication Technology, Ghaziabad, India: IEEE, 2017:1-6.
[22] VAN DER MAATEN L, HINTON G. Visualizing Data Using t-SNE[J]. Journal of Machine Learning Research,2008, 9(11):2579-2650.
HRRP Target Recognition Method Based on Fusion Network