The Journal of Korean Institute of Electromagnetic Engineering and Science

The Korean Institute of Electromagnetic Engineering and Science

J. Korean Inst. Electromagn. Eng. Sci. 2025; 36(7):674-684

pISSN: 1226-3133, eISSN: 2288-226X

DOI: https://doi.org/10.5515/KJKIEES.2025.36.7.674

논문/REGULAR PAPER

도메인 일반화 SAR-ATR을 위한 SCR 변동 기반 데이터 증강 연구

장오태

, 신희섭^*

, 옥재우^*

, 백민영^*

, 윤재혁^*

, 김경태^†

SCR Fluctuation-Based Data Augmentation for Domain Generalized SAR-ATR

Oh-Tae Jang

, Hee-Sub Shin^*

, Jae-Woo Ok^*

, Min-Young Back^*

, Jae-Hyuk Youn^*

, Kyung-Tae Kim^†

포항공과대학교 전자전기공학과

^*LIG넥스원(주)

Department of Electrical Engineering, Pohang University of Science and Technology

^*LIG Nex1 Co., Ltd

^†Corresponding Author: Kyung-Tae Kim (e-mail: kkt@postech.ac.kr)

© Copyright 2025 The Korean Institute of Electromagnetic Engineering and Science. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Mar 21, 2025; Revised: Mar 26, 2025; Accepted: Apr 08, 2025

Published Online: Jul 31, 2025

요 약

SAR(synthetic aperture radar)-ATR(automatic target recognition)은 표적을 자동으로 탐지하고 분류하는 기술이다. 그러나 실측 데이터 확보가 어렵기 때문에, 최근에는 CAD(computer-aided design) 모델과 전자기 수치해석을 활용한 합성 데이터를 학습에 활용하고 있다. 하지만 합성 데이터와 실측 데이터 간 분포 차이가 존재하여, 합성 데이터로 학습한 모델을 실측 데이터에 적용하면 성능 저하가 발생한다. 특히, 신호 대 클러터비(SCR, signal-to-clutter ratio)가 변화하면 표적과 클러터의 상대적 강도가 달라져 더욱 성능이 저하된다. 본 연구에서는 이를 해결하기 위해 SCR을 고려한 데이터 증강 기법을 제안한다. 제안된 기법은 기존 가우시안 잡음 및 GMM(Gaussian mixture model) 기반 증강과 결합이 가능하며, 다양한 환경에서도 일반화 성능을 향상시킬 수 있다. 실험 결과, SCR 기반 증강 기법을 적용한 모델이 기존 증강 없이 학습한 모델보다 평균 24 % 높은 성능을 달성함을 확인하였다.

Abstract

Synthetic aperture radar (SAR) automatic target recognition (ATR) detects and classifies targets automatically. However, acquiring real SAR data is challenging, which leads to the use of synthetic datasets generated using computer-aided design models and electromagnetic simulations. A distribution gap between the synthetic and real data causes performance degradation when trained models are applied to real data. In particular, variations in the signal-to-clutter ratio (SCR) alter the target and clutter intensities, which worsens performance. To address this issue, we propose an SCR-based data augmentation technique that integrates existing Gaussian noise and Gaussian mixture model augmentation methods to improve generalization. Experiments show that models using SCR augmentation achieve an average accuracy that is 24 % higher than that achieved by those without augmentation.

Keywords: Synthetic Aperture Radar (SAR); Automatic Target Recognition (ATR); Deep Learning; Synthetic Data

Ⅰ. 서 론

합성개구레이다(SAR, synthetic aperture radar)는 마이크로파를 이용하여 지표면을 관측하는 능동형 센서로, 광학 영상보다 날씨나 조명 조건에 영향을 받지 않고 안정적인 관측이 가능하다^[1]. 최근에는 제한된 측정 데이터만으로도 고해상도 영상을 복원할 수 있도록 압축 센싱 기반의 영상화 기법이 활용되고 있으며^[2]~[4], 영상 정합(image registration)^[5] 및 디노이징(denoising)^[6] 기술이 적용되어 신뢰도 높은 영상 분석이 가능해지고 있다. 이처럼, 안정적인 SAR 영상 확보가 가능해지면서, SAR 영상 기반 고차원 분석 기술인 자동 표적 식별(ATR, automatic target recognition)의 역할이 점차 중요해지고 있다^[7],[8].

SAR-ATR은 SAR 영상을 기반으로 표적을 자동으로 탐지하고 분류하는 기술을 의미한다. 초기에는 수작업으로 추출한 특징(feature)^[9]을 이용해 표적을 분류했으나, 특징 설계의 주관성, 데이터 복잡성 증가 등의 한계로 인해 딥러닝 기반 접근법이 주목받고 있다^[10],[11]. 딥러닝 모델은 학습을 통해 최적의 특징을 자동으로 추출할 수 있지만, 일반화 성능을 극대화하려면 다양한 환경을 반영한 대규모 데이터 셋이 필수적이다. 그러나, 실제 SAR 데이터는 획득 비용이 높아 충분한 양을 확보하기 어렵다^[12].

최근에는 CAD(computer-aided design) 모델과 전자기 수치해석을 활용한 합성(synthetic) 데이터 셋을 구축하여 데이터 획득 한계를 보완하고 있다^[13]. 하지만, CAD 모델의 기하학적 오차와 전자기 수치해석 과정에서 발생하는 근사 오차로 인해, 합성 데이터는 실측 데이터와 분포 차이(domain gap)가 존재한다. 이러한 도메인 차이는 데이터 자체에서 발생할 뿐만 아니라, 딥러닝 모델이 학습하는 특징에서도 발생하기 때문에, 합성 데이터에 학습된 딥러닝 모델은 실측 데이터에서 성능이 저하된다^13].

SAR-ATR에서 도메인 차이를 극복하기 위한 연구는 주로 데이터 증강을 활용한 도메인 일반화(domain generalization)^[13]~[15] 접근법을 중심으로 진행되어 왔다. 도메인 일반화는 특정 도메인에 과적합되지 않도록 학습하여 새로운 도메인에서도 안정적인 성능을 유지하는 방법이다. 특히, 가우시안 잡음(GN, Gaussian noise)^[14]를 활용한 기법이 연구되었으며, 클러터 영역과 표적 영역을 고려하여 가우시안 혼합 모델(GMM, Gaussian mixture model)을 기반으로 각 영역을 분리하고 분포를 다양화하는 방법^[15]이 제안되기도 했다.

그러나, 기존의 데이터 증강 연구들은 도메인 일반화 성능을 향상 시키는 과정에서 잡음에 의존하는 경향이 있으며, 이러한 방법들은 SCR(signal-to clutter ratio)이 낮거나 일정하지 않은 상황에서 일반화 성능이 저하될 가능성이 있다^[15]. 따라서, 본 연구에서는 도메인 일반화 성능을 향상시키기 위해 표적과 클러터의 SCR을 고려한 데이터 증강 기법을 제안한다. 제안된 기법은 기존의 노이즈 기반 방법과 GMM 기반 방법에 결합될 수 있어 높은 범용성을 가진다.

본 논문의 구성은 다음과 같다. Ⅱ장에서는 도메인 차이를 극복하는 기존 연구들의 동향을 정리했다. Ⅲ장에서는 SCR 기반 데이터 증강 기법에 대해 구체적으로 기술했다. Ⅳ장에서는 제안된 알고리즘의 실측 데이터에 대한 일반화 성능을 평가했다. 마지막으로 Ⅴ장에서 본 연구의 결론을 제시했다.

Ⅱ. 도메인 일반화 SAR ATR

2-1 도메인 일반화

도메인 일반화은 학습 데이터와 평가 데이터 간의 도메인 차이로 인해 발생하는 성능 저하 문제를 해결하기 위한 접근법이다. 이는 기존의 머신러닝 모델이 독립적이고 동일한 분포를 가정하는 것과 달리, 모델이 학습에 사용되지 않은 새로운 도메인에서도 높은 성능을 유지하도록 설계하는 것이 목표다^[16].

도메인 일반화를 달성하기 위해서는 도메인 정렬(domain alignment)을 수행하여 서로 다른 도메인 간의 특징 차이를 줄이고, 클래스 간의 구별력(discrimination)을 높이는 방법이 필요하다. 이를 위한 다양한 접근 방식이 연구되었으며, 크게 특징(feature) 수준 도메인 불변 표현 학습(domain invariant representation)과 픽셀(pixel) 수준 데이터 증강으로 구분할 수 있다^[16].

2-1-1 특징 수준 접근법

특징 수준에서의 도메인 일반화는 모델이 입력 데이터의 도메인에 의존하지 않고, 본질적인 정보(intrinsic feature)만을 학습하도록 유도하는 방식이다. 대표적인 접근법으로는 도메인 정렬, 도메인 불변 학습 등이 있다.

도메인 정렬은 서로 다른 도메인의 특징 분포를 정렬하여 도메인 차이를 줄이는 방법으로, 일반적으로 MMD (maximum mean discrepancy)^[17]나 적대적 도메인 학습(adversarial learning)을 활용한다. 한편, 도메인 불변 표현은 모델이 특정 도메인의 정보가 아닌 클래스간 차별적 정보를 학습하도록 유도하는 방식이다. 이는 도메인에 상관없이 표적의 내재적인 정보를 학습할 수 있어, 도메인 차이를 극복할 수 있다. 도메인 불변 표현을 학습하는 방법으로 AdaBN^[16]이나, 두 도메인 간의 통계적 차이를 줄이는 CORAL^[16](correlation alignment) 등이 활용된다.

2-1-2 픽셀 수준 접근법

픽셀 수준에서의 데이터 증강은 입력 데이터의 분포를 다양화하여 도메인 차이를 줄이는 방식이다^[16]. 이는 원본 데이터의 통계적 분포를 변형하여 여러 도메인의 데이터와 유사한 분포를 형성하도록 유도한다. 즉, 모델이 특정 도메인에 과적합되는 것을 방지하고, 새로운 도메인에서도 잘 일반화된다^[15],[16]. 일반적으로 스타일 변환, 히스토그램 정규화를 수행하여 데이터 다양성을 증가시킨다.

픽셀 수준의 데이터 증강에서 중요한 점은 평가 데이터와의 도메인 차이를 유발하는 요소들을 파악하고, 이를 고려하여 증강을 수행하는 것이다. 이는 단순히 데이터의 다양성을 증가시키는 것이 아니라, 모델이 학습 데이터와 평가 데이터 간의 핵심적인 차이를 극복하고 일반화 성능을 높이도록 유도하는 것이 목적이다^[16].

2-2 도메인 일반화 SAR ATR

SAR 영상의 도메인 차이는 전자기 수치해석 과정에서 발생하는 근사 오차를 기반으로, 센서 특성, 대기 및 환경 조건, 표적의 기하학적 변형 등 다양한 요인에 의해 더욱 복잡해질 수 있다^[13]. 이를 효과적으로 완화하기 위해 픽셀 수준에서의 증강 기법이 활용된다. 대표적으로 스페클 잡음(speckle noise)을 고려한 가우시안 잡음 증강 기법이 사용된다. SAR 영상은 간섭성을 가지는 레이다 신호를 활용하기 때문에 고유한 스페클 잡음이 포함되며, 이는 도메인 차이를 유발하는 주요 원인 중 하나다. 따라서, 학습 데이터에 랜덤한 가우시안 잡음을 추가^[14]하여 모델이 다양한 잡음 환경에서도 강인함을 유지하도록 증강하며, 센서나 환경에 따른 신호 왜곡을 보정한다.

또한, SAR 영상의 표적, 그림자, 클러터의 다양한 분포를 고려한 GMM 기반 증강 기법이 제안되었다^[15]. SAR 영상에서 표적과 클러터는 각기 다른 산란 특성을 가지며, 특히 표적의 미세한 산란점(scattering points) 변화가 영상 내에서 다르게 반영될 수 있다. 이를 고려하기 위해 GMM을 활용하여 표적과 클러터의 분포를 분할하여 데이터 증강을 수행하는 방법이 제안되었다. 이 접근법은 SAR 데이터의 분포적 다양성을 학습 데이터에 반영함으로써 도메인 차이를 줄이는 역할을 한다.

그러나, SCR은 합성 데이터와 실측 데이터의 차이뿐만 아니라, 실제 환경에서도 크게 변할 수 있는 요소이지만, 기존의 증강 기법에서는 이에 대한 고려가 부족하다. 예를 들어, 센서의 해상도나 관측 조건이 다르면 표적 대비 클러터의 상대적 강도가 달라질 수 있으며, 이는 모델의 성능에 직접적인 영향을 미친다. 하지만 기존의 가우시안 잡음 증강이나 GMM 기반 접근법은 이러한 변화를 직접 반영하지 못하기 때문에, 정교한 증강 기법이 필요하다. 이러한 한계를 극복하기 위해 본 연구에서는 SCR을 고려한 데이터 증강 기법을 제안하여, 기존의 가우시안 잡음 기반 증강과 GMM 기반 증강 기법의 장점을 결합하는 것을 목표로 한다.

Ⅲ. SCR 변동 기반 데이터 증강

3-1 도메인 일반화 문제

도메인 일반화 문제에서 두 가지 도메인을 정의한다. 학습에 활용되는 서로 다른 k개의 분포를 가진 소스 도메인 $D s = D s k = X k, Y k k = 1 K$ 는 합성 데이터(k = 1)와 이의 증강된 도메인(k > 1)으로 정의된다.

학습 과정에서 활용되지 않는 타겟 도메인 D_t = [X_T]는 실측 데이터를 의미한다. 여기서, X는 입력 데이터를, Y는 이에 대응되는 정답 라벨을 의미한다^[16].

P S k ≠ P T ∀ k ∈ 1, …, K

(1)

식 (1)은 소스 도메인 분포인 P_S와 표적 도메인의 분포 P_T가 서로 다른 분포를 가진다는 것을 의미하며, K는 전체 소스 도메인의 개수를 나타낸다^[16]. 본 연구에서는 픽셀 수준에서 SAR의 SCR 특성을 고려하여 데이터 증강을 수행하고, 그 결과로 $D s a u g = X s a u g, Y s a u g$ 를 생성하는 것을 목표로 한다. 이때, 전체 도메인 수는 K = 2로 정의되며, 합성 데이터(k = 1)와 증강된 데이터(k = 2)를 포함한다.

3-2 SCR 변동 기반 데이터 증강 방법

도메인 일반화 방법 중 랜덤화를 활용한 데이터 증강은 모델이 특정 패턴에 과적합되는 것을 방지하고, 다양한 입력 분포에 적응할 수 있도록 한다. 이는 데이터 샘플 간의 분산을 증가시켜, 학습 과정에서 입력의 도메인 특성에 관계없이 일관된 반응을 보이는 도메인에 불변한 (domain-agnostic)한 특징을 학습하게 만든다^[15].

본 연구에서는 이러한 원리에서 SAR 영상의 클러터가 높은 변동성을 가지며, 특정 분포로 명확히 모델링되기 어렵다는 특성을 고려하였다^[24]. 실제 SAR 영상에는 균일(homogeneous)와 비균일(heterogeneous) 클러터가 혼재되어 있으나, 합성 SAR 영상에서는 주로 균일 클러터만이 반영되어 있다^[13]. 이로 인해, 합성 SAR 영상으로 학습된 모델은 특정한 클러터 분포에만 과적합되며, 클러터 분포가 상이한 비균일 클러터 뿐만 아니라, 합성 데이터와 실측 데이터 간 도메인에 따른 분포 차이가 존재하는 경우에도 일반화 성능이 급격히 저하된다.

따라서, 본 연구는 클러터 영역의 통계적 다양성을 확장하기 위해, SAR의 주요 특성인 SCR 변동성을 랜덤화하는 방식을 제안한다. 이를 통해 모델은 클러터 영역에 대해 도메인별 차이를 민감하게 받아들이지 않고, 상대적으로 안정적인 표적 영역에 집중하여 학습하게 된다. 결과적으로, 다양한 클러터 분포와 더불어 서로 다른 도메인 간 클러터 분포 차이에 대해서도 일관된 판단이 가능한 특징을 효과적으로 학습하여, 도메인 일반화 성능 향상을 이끌어 낼 수 있다. 그림 1(a)는 제안된 SCR 변동 기반 알고리즘의 순서도를 나타낸다.

S C R = 20 log 10 max p, q ∈ I T I T (p, q) C

(2)

C = 1 N c ∑ p ′ ∑ q ′ I c p ′, q ′

(3)

그림 1. | Fig. 1. 제안된 알고리즘 순서도 | Flowchart of the proposed algorithm.

Download Original Figure

식 (2) 및 식 (3)은 SCR에 대한 정의를 나타낸다. 여기서 I_T와 I_C는 각각 표적과 클러터 영역의 영상을 의미하며, N_C는 클러터 영역의 픽셀 개수를 의미한다. 먼저, 합성 SAR 영상인 I_synth ∊ X_synth 을 Choi 등^[10]의 알고리 즘을 활용하여, 표적 영역인 I_T과 그림자 영역 I_S을 추출한다. 이 후, 입력 영상, 표적, 그림자를 그리고 클러터 영역의 관계식인 I_C = I_synth − I_T − I_C 를 통해 클러터 영역을 추출한다. SCR의 랜덤화를 수행하기 위해, SCR 값을 무작위로 선정하여 SCR′을 정의한다. SCR′과 식 (4)를 활용하여 새로운 클러터 평균 밝기 C′를 정의 한다.

C ′ = max p, q ∈ I T I T (p, q) 10 S C R ′ 20 .

(4)

이 후, I_C′(p′,q′) = I_C(p′,q′)+(C′ − C)를 활용하여 SCR을 변화시킨 새로운 클러터 영역을 정의한다. 마지막으로, I_T+I_S+I_C′을 통해 표적, 그림자, 클러터 영역을 통합한다. 해당 알고리즘을 통해 생성된 데이터셋은 $D s a u g = X s a u g, Y s a u g$ 을 담당한다.

제안된 증강 방식은 SCR이 다양한 환경에서도 딥러닝 모델의 일반화 성능을 향상시키며, 실측 및 합성 데이터간의 도메인 차이를 줄이는 데 기여할 수 있다. 또한, 기존의 가우시안 잡음^[14] 및 GMM 기반 증강 기법^[15]과 결합하여 범용성을 확보할 수 있다. 그림 1(b) 및 그림 1(c)에는 각각 가우시안 잡음 및 GMM 기반 증강 기법에 제안된 알고리즘이 결합한 순서도를 나타낸다.

제안된 기법에서는 먼저 SCR을 조정한 뒤, 가우시안 잡음 또는 GMM 기반 증강을 적용한다. 불규칙적인 밝기 변화를 유발하는 가우시안 잡음에 앞서 SCR을 조정하여 표적의 SCR을 효과적으로 반영할 수 있다. 또한, SCR을 먼저 조정함으로써 GMM 기반 증강에서 클러터의 확률적 변화를 다양하게 반영할 수 있으며 결과적으로 강인한 일반화 성능을 확보할 수 있다.

Ⅳ. 제안 기법 성능 분석

4-1 실험 방안

제안된 SCR 기반 증강 기법의 실험을 위해, SAMPLE 데이터셋^[13]을 활용했다. SAMPLE 데이터셋은 합성 데이 터와 실측 데이터의 방위각, 경사각이 모두 동일한 쌍을 이루는 데이터로 구성되어 있으며, 총 10개의 클래스로 구성된다. 그림 2는 SAMPLE 데이터셋의 합성 데이터와 실측 데이터 예시를 보여주며, 표 1은 합성과 실측 데이터의 개수를 나타낸다. 또한, 그림 3은 합성 데이터와 실측 데이터 간의 분포 차이를 나타내는 t-SNE(t-distributed stochastic neighbor embedding) 시각화 결과^[21]이다.

그림 2. | Fig. 2. 합성 데이터와 실측 데이터의 예시^[13] | Examples of synthetic data and measured data^[13].

Download Original Figure

표 1. | Table 1. 합성 데이터와 실측 데이터의 데이터셋 구성 | Composition of synthetic and measured data.

	Synthetic (train)	Measured (test)
2s1	174	174
bmp2	107	107
btr70	92	92
m1	129	129
m2	128	128
m35	129	129
m548	129	129
m60	176	176
t72	108	108
zsu23	174	174

Download Excel Table

그림 3. | Fig. 3. 합성 데이터와 실측 데이터의 t-SNE^[21] 시각화 | T-SNE visualization of synthetic and measured data.

Download Original Figure

비교군으로는 도메인 일반화를 목적으로 한 데이터 증강 기법^[14],[15]과, CNN 기반 ATR 방법에서 널리 사용되는 기하학적 변형 기반의 전통적인 증강 기법^[22]을 포함하였다. 전통적인 증강 기법에서는 회전(rotation) 각도 ±60도, 병진 이동(translation) ±20 %, 크기 조정(scaling) 0.8배에서 1.2배 범위로 설정하여 무작위로 적용하였다. 또한, SCR 변동이 도메인 일반화 성능 향상에 미치는 영향을 평가하기 위해, 제안된 기법을 합성 데이터, 가우시안 잡음(GN, Gaussian noise) 기반 기법^[14], 그리고 GMM 기반의 SSR(soft segment randomization)^[15]과 결합하여 실험을 수행하였다. 그림 4는 증강된 데이터의 예시를 나타낸다. 모든 데이터셋은 10배 증강을 적용했고, 가우시안 잡음은 평균 0, 분산 0.03으로 설정하였다. 평가 데이터셋으로는 실측 데이터와 SCR 변동, 그리고 미지에 클러터가 포함된 실측 데이터를 활용했다.

그림 4. | Fig. 4. 증강된 데이터의 예시 | Example of augmented data.

Download Original Figure

또한, SAR ATR에 범용적으로 활용되고 있는 CNNs (convolutional neural networks)기반 ResNet18^[17], Mobile Net V2^[18], EfficientNet^[19], AM-CNN^[20], AconvNet^[11] 모델을 활용하여 일반화 성능을 검증했다. ResNet18은 잔차 연결(residual connection)을 통해 깊은 네트워크에서도 학습 효율을 유지하는 대표적인 구조이며, MobileNet V2는 경량화를 위해 inverted residual 구조와 depthwise convolution을 도입한 모델이다. EfficientNet은 모델 크기와 연산량의 균형을 최적화한 구조로, 적은 파라미터로도 높은 성능을 보인다. AM-CNN은 채널, 공간에서의 중요도를 반영하는 어텐션(attention) 모듈을 결합한 CNN 구조이며, AConvNet은 SAR 영상에 특화된 구조로 적은 가중치로 설계된 합성곱 필터를 사용하는 것이 특징이다.

4-2 SCR 변동 강도 분석

먼저, SCR 값의 변동 강도에 따른 민감도 분석을 위해, −α 에서 +α 범위로 SCR을 변화시키며 실험을 수행하였다. 실험에 활용된 SAMPLE 데이터셋의 모든 합성 영상의 평균 SCR은 약 9.2 dB이다. 일반적으로 금속 구조물로 이루어진 표적 영역의 RCS가 자연 클러터보다 크다는 점을 고려하여, α는 0.5부터 0.5씩 증가시켜 최대 7 dB까지 SCR 변동을 부여하였다.

그림 5는 SCR 변동 강도(α)에 따른 각 딥러닝 모델의 성능 변화를 나타낸다. α값이 0.5 dB에서 5 dB까지 증가함에 따라 모델의 도메인 일반화 성능은 점진적으로 향상되었으나, 5.5 dB 이상에서는 오히려 성능이 감소하는 경향을 보였다. 우선, α가 0.5 dB에서 2.5 dB 구간에서는 도메인 불변 특징을 효과적으로 학습하기에는 랜덤화 강도가 부족하였던 것으로 해석된다. 반면, α가 5.5 dB 이상에서는 과도한 SCR 변동으로 인해 모델이 표적의 형상과 관련된 특징을 안정적으로 학습하는 데 어려움을 겪게 되면서, 오히려 성능 저하로 이어진 것으로 해석된다. 이에 따라, 본 연구에서는 성능 향상과 안정성 간의 균형을 고려하여 α=5 dB를 최적값으로 설정하였다.

그림 5. | Fig. 5. SCR 변동 강도(α)에 따른 성능 | Performance according to the intensity of SCR fluctuation.

Download Original Figure

4-3 실측 데이터 셋 성능 평가

표 2는 데이터 증강 방법에 따른 실측 데이터에서의 평가 성능을 비교한 결과를 나타낸다. 전통적인 증강 기법을 적용한 모델은 실측 데이터에서 평균적으로 약 36 %의 성능 저하를 보였다. 이는 병진 이동과 회전 과정에서의 제로 패딩(zero padding)이 모델 학습을 방해하고, 표적이나 클러터에 집중하기보다는 불필요한 외곽 정보에 의해 혼란을 발생했기 때문이다. 이 결과는 단순히 데이터수를 증가시키는 것만으로는 일반화 성능을 확보할 수 없으며, 도메인 특성과 데이터의 의미를 고려한 증강이 중요하다는 것을 보여준다.

표 2. | Table 2. 데이터 증강에 따른 실측 데이터셋에서의 식별률 | Classification accuracy on measured dataset with data augmentation.

Model	Conventional augmentation			Domain generalization
	Translation, rotation, scaling (TRS)			SCR fluct (SCR)			Gaussian noise (GN)			Soft segment randomization (SSR)
	Synth.(A)	Synth.+TRS(B)	Difference (B-A)	Synth.(C)	Synth.+SCR(D)	Difference (D-C)	GN(E)	GN+SCR(F)	Difference (E-F)	SSR(G)	SSR+SCR(H)	Difference (H-G)
ResNet18	73.91	30.93	−42.98^*	73.91	87.96	+14.05^**	82.60	89.14	+6.54^**	89.14	90.11	+0.97^**
MobileNetV2	26.93	19.48	−7.45^*	26.93	85.42	+58.49^**	56.38	89.07	+32.69^**	81.26	89.59	+8.33^**
EfficientNet	79.56	23.27	−56.29^*	79.56	81.12	+1.56^**	71.30	85.79	+14.49^**	88.84	88.77	−0.07^*
AconvNet	57.69	24.83	−32.86^*	57.69	83.94	+26.25^**	75.53	84.90	+9.37^**	88.99	82.90	−6.09^*
AM-CNN	69.67	27.88	−41.79^*	69.67	92.79	+23.12^**	79.85	91.89	+12.04^**	91.07	93.38	+2.31^**
Average	61.55	25.28	−36.27^*	61.55	86.25	+24.7^**	73.13	88.16	+15.03^**	87.86	88.95	+1.09^**

Indicates performance decrease.

Indicates performance increase.

Download Excel Table

도메인 일반화 증강 기법들의 결과에서는 합성 데이터로만 학습된 모델이 동일 도메인에서 모든 모델이 99 % 이상의 성능을 기록했음에도 불구하고, 실측 데이터에서는 성능이 크게 저하되었다. 이는 픽셀 수준에서 발생하는 도메인 차이가 특징 수준에서 극복되지 않음을 보여준다. 그러나, 제안한 SCR 기반 증강 기법은 SAR 영상의 고유한 특성인 클러터와 표적 간의 반사 강도 차이를 반영함으로써, 도메인 일반화에 효과적임을 보여준다. 특히, 클러터에 강인한 학습을 유도하여 도메인 간 분포 차이에 덜 민감한 안정적인 특징 학습을 가능하게 한다.

다음으로, 가우시안 잡음을 통한 데이터 증강의 경우 합성 데이터만을 활용했을 때보다 평균적으로 11.58 % 향상되었으나, 여전히 도메인 차이가 존재했다. 가우시안 잡음에 SCR 증강을 적용한 경우, 모든 모델에서 성능이 크게 향상되었으며, 평균적으로 15.03 % 향상을 기록했다. 이는 가우시안 잡음이 SAR 영상 전체에 랜덤한 값을 추가하여 클러터 분포에서 지역적인 밝기 변화를 유도하지만, 변동성을 충분히 고려하지 못하기 때문이다. 반면 SCR 증강을 추가한 경우, 클러터 영역에 전역적 밝기 변화를 유도하여 변동성을 고려할 수 있다. 또한, SCR 증강과 결합한 가우시안 잡음은 클러터 뿐만 아니라 표적 및 그림자에도 밝기 변화를 고려할 수 있어, 합성 데이터만을 활용하는 것보다 더 높은 성능 향상을 이끌어낸다.

마지막으로, SSR 데이터 증강은 앞선 두 기법과 달리 표적, 그림자, 클러터 영역을 가우시안 모델을 통해 종합적으로 고려하기 때문에 도메인 차이를 완화할 수 있다는 것을 보여준다. 여기에 SCR을 추가할 경우, 클러터의 변동성이 더욱 다양화되며, 성능이 1.09 % 향상된다.

그림 6은 각각 합성 데이터, 가우시안 잡음, SSR 증강에 대한 t-SNE 시각화 결과^[21]를 나타낸다. 여기서 ‘o’는 합성 데이터의 특징, ‘x’는 측정 데이터의 특징을 의미한다. t-SNE를 통한 시각화 결과를 살펴보면, SCR 증강을 적용한 모든 실험에서 클래스 간의 구별성이 향상되었다. 또한, 그림 3의 픽셀 수준에서의 데이터 분포와 비교하였을 때, 도메인 정렬이 잘 수행된다. 이를 통해, SCR을 고려하는 것이 합성 데이터와 실측 데이터 간의 도메인 차이를 완화할 수 있다는 것을 실험적으로 보여준다.

그림 6. | Fig. 6. T-SNE를 통한 잠재 공간 시각화 | Visualization of latent space using t-SNE.

Download Original Figure

4-4 Unknown Clutter에 대한 모델 성능 비교

표 3은 학습 데이터와 평가 데이터 간 도메인 차이가 존재하는 상황에서, 미지의 클러터(unknown clutter)가 포함된 평가 데이터셋에 대한 각 증강 기법의 식별 성능을 비교한 결과를 나타낸다. 합성 SAR 데이터셋은 균일 클러터 환경만을 기반으로 모델링되어 있어, 비균일 클러터에 대한 정보는 포함되어 있지 않다^[13]. 반면, 실측 데이터는 균일 클러터뿐만 아니라 나무와 같은 식생 및 복잡한 지형 구조를 포함한 비균일 클러터 환경을 함께 제공한다^[24]. 이에 따라, 균일 클러터 기반으로만 학습된 모델이 비균일 클러터가 포함된 환경에서도 일반화 성능을 유지할 수 있는지를 검증하기 위해, MSTAR 클러터 영상을 실측 영상에 합성하여 실험을 수행하였다^[24]. 그림 7은 실측 SAR 영상에서 다양한 클러터가 포함된 예시를 보여준다.

표 3. | Table 3. 데이터 증강에 따른 미지의 클러터에서의 평가 성능 | Evaluation performance on unknown clutter with data augmentation.

Model	Synth.	Synth+SCR	GN	GN+SCR	SSR	SSR+SCR
ResNet18	70.71	79.85	77.62	79.41	84.83	84.75
MobileNetV2	34.94	82.45	57.03	82.38	77.84	89.07
EfficientNet	64.91	77.84	69.73	84.54	83.79	85.87
AconvNet	52.45	73.23	65.13	75.84	78.14	75.16
AMCNN	65.87	85.72	75.24	87.73	85.87	85.79
AVG	57.78	79.82	68.95	81.98	82.09	84.13

Download Excel Table

그림 7. | Fig. 7. 미지의 클러터가 포함된 실측 데이터의 예시 | An example of measured data containing unknown clutter.

Download Original Figure

합성 데이터 기반 모델은 평균적으로 22 %의 성능 향상을 보였으며, 가우시안 잡음에 SCR 증강을 추가한 경우에는 13 %, SSR에 SCR 증강을 추가한 경우에는 2 %의 추가 성능 향상이 나타났다. 주목 할 점은, 학습 데이터에 미지의 클러터가 포함되지 않았음에도 SCR 변동 기반 증강 기법이 도메인 차이와 클러터의 복잡한 변동성 완화에 효과적이었다는 것이다. 즉, 비균일 클러터를 명시적으로 모델링하지 않고도 SCR 랜덤화를 통해 변화된 환경에서도 도메인 불변의 특징을 학습할 수 있음을 보여준다.

4-5 SCR에 따른 모델 성능 비교

학습 데이터와 평가 데이터의 도메인 차이가 발생한 상황에서, SCR에 변동이 성능에 미치는 영향을 분석하기 위해, 식별 데이터셋에 SCR 변동을 추가하여^[23], 각 증강 기법별 식별 성능을 비교했다. 그림 8 및 그림 9, 표 4 및 표 5는 각각 실측 데이터에서 높은 성능을 기록한 ResNet과 AM-CNN에 대해 SCR 변동에 따른 식별률 변화를 나타낸 것이다.

그림 8. | Fig. 8. 실측 데이터의 SCR 변동에 따른 식별률(ResNet18) | Classification accuracy based on SCR fluctuation in measured data (ResNet18).

Download Original Figure

그림 9. | Fig. 9. 실측 데이터의 SCR 변동에 따른 식별률(AM-CNN) | Classification accuracy based on SCR fluctuation in measured data (aM-CNN).

Download Original Figure

표 4. | Table 4. 실측 데이터의 SCR 변동에 따른 식별률(ResNet18) | Classification accuracy based on SCR fluctuation in measured data (ResNet18).

SCR Fluct. (dB)	Synth	Synth+SCR	GN	GN+SCR	SSR	SSR+SCR
−3	21.7	68.8	18.7	73.8	77.2	74.2
−2.5	28.9	74.7	23.6	82.3	81.7	81.9
−2	36.8	79.5	33.5	86.2	85.4	87.1
−1.5	48.1	83.5	46.7	87.7	87.3	89.4
−1	58.8	85.5	61.5	88.9	88.3	90.2
−0.5	67.9	86.5	74.6	88.8	88.6	90.5
0	73.9	88.0	82.6	89.1	89.1	90.1
0.5	75.8	88.1	85.4	89.3	88.9	89.9
1	76.8	88.1	88.3	88.3	88.7	89.7
1.5	76.2	87.6	88.6	88.1	88.8	89.3
2	75.8	87.7	88.4	87.5	88.6	88.7
2.5	74.9	87.9	88.2	87.1	88.3	88.5
3	72.2	87.5	87.4	86.7	87.9	88.4

Download Excel Table

표 5. | Table 5. 실측 데이터의 SCR 변동에 따른 식별률(AM-CNN) | Classification accuracy based on SCR fluctuation in measured data (AM-CNN).

SCR Fluct. (dB)	Synth	Synth+SCR	GN	GN+SCR	SSR	SSR+SCR
−3	16.1	74.1	14.6	76.7	72.4	77.8
−2.5	21.7	81.6	18.0	82.2	80.9	85.1
−2	26.2	86.8	19.2	86.0	86.1	89.3
−1.5	33.5	89.9	25.8	89.2	89.2	91.2
−1	44.9	91.3	41.3	90.9	90.0	92.5
−0.5	60.1	92.4	60.6	91.5	91.1	93.6
0	70.3	92.8	79.9	91.9	91.1	93.4
0.5	76.0	92.6	86.5	92.0	90.7	93.0
1	80.2	91.8	89.1	92.0	90.9	92.8
1.5	83.9	91.5	88.8	91.9	90.8	92.3
2	84.5	91.2	89.4	92.1	90.4	91.5
2.5	85.4	90.8	90.4	92.0	90.3	91.2
3	86.1	90.9	90.0	91.5	90.0	90.9

Download Excel Table

먼저, 합성 데이터만으로 학습된 모델과 가우시안 잡음을 적용하여 학습된 모델은 SCR 변동이 −3 dB에 가까워질수록, 성능이 크게 하락하는 경향을 보였다. 이는 클러터의 변동성이 커질수록 모델의 일반화 성능이 저하됨을 의미한다. 또한, 실측 데이터의 분석 결과와 마찬가지로, 가우시안 잡음을 추가하여 지역적인 밝기 변화만 고려한 경우, 클러터의 변동성을 충분히 고려하지 못한다.

그러나, SCR 증강을 추가한 경우, 실측 데이터의 SCR이 변동된 상황에서도 성능이 향상되었으며, 합성 데이터와 실측 데이터 간 분포 차이 뿐만 아니라, SCR이 변동된 클러터 환경에서도 일반화 성능이 개선될 수 있음을 보여준다. 특히, SSR 기반 증강 기법은 클러터의 통계적 다양성을 반영함으로써, SCR이 낮아지는 환경에서도 상대적으로 성능 저하 폭이 작았다. 여기에 추가적으로 SCR 변동을 함께 적용할 경우, 표적과 클러터 간의 대비 변화까지 함께 반영되면서 더욱 안정적인 특징 학습이 가능해져 일반화 성능이 향상된다는 것을 보여준다.

4-6 단일 증강 기법에 따른 성능 비교

SCR 조정, 가우시안 잡음, SSR 증강 기법 각각의 독립적인 효과를 비교하였다. 표 2 및 표 3에 따르면, SSR이 가장 높은 성능을 보였다. 이는 SSR이 클러터뿐만 아니라 표적 영역까지 함께 변형했기 때문이다. 하지만, SSR에 SCR 증강을 결합할 경우 성능이 추가로 향상됨을 통해 두 기법의 보완적인 관계를 확인할 수 있다.

한편, 그림 8 및 그림 9에서는 SCR 변동 상황에서의 모델 성능 차이가 드러났다. ResNet 계열 모델에서는 GMM이 가장 높은 성능을 달성한 반면, AMCNN 모델에서는 SCR이 가장 높은 성능을 달성하였다. 이는 AMCNN이 공간 어텐션 모듈을 활용하여 표적에 집중하는 능력이 강해, 표적 자체는 변형하지 않는 SCR 조정 방식이 어텐션 효과를 더욱 강화했기 때문이다. 이러한 결과는 데이터 증강 기법의 선택뿐만 아니라, 딥러닝 모델 내부의 구조적 설계 또한 성능에 큰 영향을 미친다는 것을 보여준다.

Ⅴ. 결 론

본 연구는 SAR-ATR의 도메인 일반화 문제를 해결하기 위해, 표적과 클러터 간의 SCR 변동성을 반영한 데이터 증강 기법을 제안하였다. 제안된 방법은 기존의 가우시안 잡음 또는 GMM 기반 증강 기법과 결합이 가능하며, 클러터 영역의 다양화를 통해 도메인 차이에 강인한 특징 학습을 유도한다. 제안된 방법은 증강을 사용하지 않은 경우 보다 약 24 % 높은 성능을 달성했으며, 특히 균일 클러터만을 활용해 학습하였음에도 비균일 클러터 환경과 SCR 변동 상황에서도 높은 일반화 성능을 달성하였다. 이는 클러터의 통계적 특성과 SCR을 다양화할수록, 모델이 더 강인한 특징을 학습한다는 것을 보여준다.

Acknowledgements

이 연구는 2022년도 정부(방위사업청)의 재원으로 국방기술진흥연구소의 지원을 받아 수행된 연구임(KRIT-CT-22-060).

References

[1].

I. G. Cumming, F. H. Wong, Digital Processing of Synthetic Aperture Radar Data, Norwood, MA, Artech House, pp. 108-110, 2005.

[2].

M. S. Kang, J. M. Baek, “Compressive sensing-based Omega-K algorithm for SAR focusing,” IEEE Geoscience and Remote Sensing Letters, vol. 22, p. 4003405, Jan. 2025.

[3].

M. S. Kang, J. M. Baek, “Efficient SAR imaging integrated with autofocus via compressive sensing,” IEEE Geoscience and Remote Sensing Letters, vol. 19, p. 4514905, Oct. 2022.

[4].

M. S. Kang, J. M. Baek, “SAR image reconstruction via incremental imaging with compressive sensing,” IEEE Transactions on Aerospace and Electronic Systems, vol. 59, no. 4, pp. 4450-4463, Aug. 2023.

[5].

M. S. Kang, K. T. Kim, “Automatic SAR image registration via Tsallis entropy and iterative search process,” IEEE Sensors Journal, vol. 20, no. 14, pp. 7711-7720, Jul. 2020.

[6].

M. S. Kang, J. M. Baek, “Effective denoising of InSAR phase images via compressive sensing,” IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, vol. 17, pp. 17772-17779, May 2024.

[7].

I. H. Lee, K. M. Lee, M. G. Cho, Y. J. Park, S. W. Kim, and K. T. Kim, “SAR noise jamming performance evaluation using SAR-ATR,” The Journal of Korean Institute of Electromagnetic Engineering and Science, vol. 34, no. 7, pp. 581-590, Jul. 2023.

[8].

U. K. Majumder, E. P. Blasch, and D. A. Garren, Deep Learning for Radar and Communications Automatic Target Recognition, Norwood, MA, Artech House, 2020.

[9].

N. H. Jeong, J. H. Choi, G. Lee, J. H. Park, and K. T. Kim, “Principal component analysis-based dense target discrimination method for satellite synthetic aperture radar images,” The Journal of Korean Institute of Electromagnetic Engineering and Science, vol. 33, no. 8, pp. 649-657, Aug. 2022.

[10].

J. H. Choi, M. J. Lee, N. H. Jeong, G. Lee, and K. T. Kim, “Fusion of target and shadow regions for improved SAR ATR,” IEEE Transactions on Geoscience and Remote Sensing, vol. 60, p. 5226217, Apr. 2022.

[11].

S. Chen, H. Wang, F. Xu, and Y. Q. Jin, “Target classification using the deep convolutional networks for SAR images,” IEEE Transactions on Geoscience and Remote Sensing, vol. 54, no. 8, pp. 4806-4817, Aug. 2016.

[12].

M. Back, J. Ok, and H. Shin, “Benchmarking SAR target detection networks and analysis of degradation depending on the phase error,” The Journal of Korean Institute of Electromagnetic Engineering and Science, vol. 35, no. 10, pp. 770-779, Oct. 2024.

[13].

B. Lewis, T. Scarnati, E. Sudkamp, J. Nehrbass, S. Rosencrantz, and E. Zelnio, “A SAR dataset for ATR development: Tthe synthetic and measured paired labeled experiment(SAMPLE),” in Proceedings of the SPIE 10987, Algorithms for Synthetic Aperture Radar Imagery XXVI; 109870H, Baltimore, MD, May 2019.

[14].

N. Inkawhich, M. J. Inkawhich, E. K. Davis, U. K. Majumder, E. Tripp, and C. Capraro, et al., “Bridging a gap in SAR-ATR: Training on fully synthetic and testing on measured data,” IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, vol. 14, pp. 2942-2955, Feb. 2021.

[15].

M. Kim, O. Jang, H Song, H. Shin, J. Ok, and M. Back, et al., “Soft segmented randomization: Enhancing domain generalization in SAR ATR for synthetic-to-measured,” IEEE Access, vol. 12, pp. 175801-175816, Nov. 2024.

[16].

K. Zhou, Z. Liu, Y. Qiao, T. Xiang, and C. C. Loy, “Domain generalization: A survey,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 45, no. 4, pp. 4396-4415, Apr. 2022.

[17].

K. He, X. Zhang, S. Ren, and J. Sun, “Deep residual learning for image recognition,” in 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR), Las Vegas, NV, Jun. 2016, pp. 770-778.

[18].

M. Sandler, A. Howard, M. Zhu, A. Zhmoginov, and L. C. Chen, “MobileNetV2: Inverted residuals and linear bottlenecks,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(CVPR), Salt Lake City, UT, Jun. 2018, pp. 4510-4520, 2018.

[19].

M. Tan, Q. Le, “EfficientNet: Rethinking model scaling for convolutional neural networks,” in Proceedings of the 36 th International Conference on Machine Learning, PMLR, Long Beach, CA, Jun. 2019, pp. 6105-6114.

[20].

M. Zhang, J. An, D. H. Yu, L. D. Yang, L. Wu, and X. Q. Lu, “Convolutional neural network with attention mechanism for SAR automatic target recognition,” IEEE Geoscience and Remote Sensing Letters, vol. 19, p. 4004205, Nov. 2020.

[21].

L. van der Maaten, G. Hinton, “Visualizing data using t-SNE,” Journal of Machine Learning Research, vol. 9, pp. 2579-2605, Nov. 2008.

[22].

J. Ding, B. Chen, H. Liu, and M. Huang, “Convolutional neural network with data augmentation for SAR target recognition,” IEEE Geoscience and Remote Sensing Letters, vol. 13, no. 3, pp. 364-368, Mar. 2016.

[23].

B. Peng, J. Xie, B. Peng, and L. Liu. "Learning invariant representation via contrastive feature alignment for clutter robust SAR ATR,” IEEE Geoscience and Remote Sensing Letters, vol. 20, p. 4014805, Nov. 2023.

[24].

M. S. Greco, F. Gini. "Statistical analysis of high-resolution SAR ground clutter data,” IEEE Transactions on Geoscience and Remote sensing, vol. 45, no. 3, pp. 566-575, Mar. 2007.