논문/REGULAR PAPERS

다중편파 SAR 합성 변환과 딥러닝을 활용한 선박 및 빙산 이진분류 알고리즘 성능 개선 연구

채승병https://orcid.org/0009-0007-8340-077X, 강민석https://orcid.org/0000-0002-7021-6873
Seung-Byung Chaehttps://orcid.org/0009-0007-8340-077X, Min-Seok Kanghttps://orcid.org/0000-0002-7021-6873
Author Information & Copyright
국립공주대학교 전기전자제어공학부
Division of Electrical, Electronic & Control Engineering, Kongju National University
Corresponding Author: Min-Seok Kang (e-mail: mskang@kongju.ac.kr)

© Copyright 2025 The Korean Institute of Electromagnetic Engineering and Science. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Jan 13, 2025; Revised: Jan 24, 2025; Accepted: Feb 18, 2025

Published Online: May 31, 2025

요 약

본 논문은 다중편파(polarimetric) 합성 개구면 레이다(SAR, synthetic aperture radar)와 딥러닝 기법을 활용하여 선박 및 빙산의 이진분류 성능을 개선하는 방법을 제안한다. 다중편파 SAR로부터 선형 변환을 통해 혼합 4중편파(hybrid quadrature polarimetric) 데이터를 생성하고, 기존의 다중편파 SAR 데이터셋에 포함하여 이진분류 성능을 향상시켰다. 실험에서는 다양한 합성곱 신경망(convolutional neural network) 모델을 사용하여 학습하였으며, 사전 학습되지 않은 상태로 초기화된 모델 간 성능을 비교하였다. 캐글(kaggle)에서 제공하는 공개 SAR 데이터셋을 활용하여 실험한 결과, 다중편파 SAR 데이터를 활용한 변환 기법이 선박 및 빙산의 분류 성능 향상에 효과적임을 입증하였다.

Abstract

In this study, a method for improving the binary classification performance of ships and icebergs using polarimetric synthetic aperture radar (SAR) and deep-learning techniques is proposed. A linear transformation is applied to the polarimetric SAR data to generate hybrid quadrature polarimetric SAR data, which are then incorporated into the existing polarimetric SAR dataset to improve the classification performance. The experiments employed various convolutional neural network models for training, and the performances of the models initialized without pretraining were compared. Using a publicly available SAR dataset from Kaggle, the results demonstrated that the transformation techniques utilizing polarimetric SAR data effectively enhanced the classification performance of ships and icebergs.

Keywords: Binary classification; deep learning; hybrid quadrature polarimetric; polarimetric SAR

I. 서 론

해양 환경 모니터링과 해상 교통 안전은 점점 더 중요한 분야로 부각되고 있으며, 선박과 빙산의 정확한 탐지 및 분류는 해양 사고 예방과 기후 변화 대응에 필수적이다. 합성 개구면 레이다(SAR, synthetic aperture radar)는 항공기나 위성에 안테나를 탑재하여 지표면의 고해상도 영상을 생성할 수 있는 레이다 기술이다. 날씨나 주야간에 구애받지 않고 고해상도 영상 생성이 가능하며 정밀 지도 제작, 재난 관리, 표적 탐지 등 다양한 분야에서 핵심적으로 활용되고 있다[1]~[7]. 다중편파 SAR는 여러 가지 편파들의 조합을 통해 관심영역의 영상을 생성하는 방법이다. 한가지 편파를 사용하여 획득한 SAR 영상은 특정 편파의 반사 특성만 고려하므로, 영상의 표현이 제한적일 수 있다. 다중편파를 사용하면 동일한 목표물에 서로 다른 편파 영상을 획득해서 관심영역의 정보가 풍부해져 물체를 더 명확하게 식별할 수 있다.

본 연구는 선박 및 빙산 이진분류의 성능 개선을 위해 다중편파 SAR 변환 기법과 다양한 딥러닝 모델을 활용한 성능 비교를 수행한다. 주어진 SAR 데이터에 합성 변환을 적용하여 생성한 SAR 영상을 기존 데이터셋에 포함하여 분류 성능의 개선을 확인하였다. 또한, 전통적인 머신러닝 기법인 서포트 벡터 머신(SVM, support vector machine)[8]과 다양한 합성곱 신경망(CNN, convolutional neural network) 모델을 활용하여 성능을 정량적으로 비교하였다. 이를 통해 선박 및 빙산 SAR 영상 이진분류 작업에서 CNN 모델의 우수성을 검증하였다.

II. 본 론

2-1 다중편파 SAR 변환

항공기나 위성에 탑재된 SAR가 한 가지 모드의 편파만 사용하는 경우, 관심영역의 데이터는 풍부한 정보를 제공하지 못하는 한계가 있다. 다중편파 SAR는 다양한 편파 특성을 조합하여 관측 영역의 정보를 더욱 풍부하게 제공한다. 본 연구에서는 다중편파 SAR 편파 특성을 활용하여 선박과 빙산의 이진분류 성능을 개선하고자 한다.

그림 1은 다중편파 SAR의 동작 방식을 도시한다. 다중편파 SAR는 관심영역에 X 및 Y의 2가지 편파를 반복적으로 송신하고, 산란 후 반사된 X 및 Y의 2가지 편파를 동시에 수신한다. X와 Y는 임의의 편파 종류를 의미한다. 일반적으로 편파모드는 XX, XY, YX, YY 4가지 편파모드의 조합으로 구성되며, 2×2 복소산란행렬(sinclair matrix)로 나타낼 수 있다. 각각의 편파모드는 다중편파 SAR의 기저(basis)이다.

jkiees-36-5-490-g1
그림 1. | Fig. 1. 다중편파 SAR 동작 방식 | Polarimetric SAR operation method.
Download Original Figure

다중편파 SAR에서 주로 사용되는 편파는 선형편파(linear polarization)와 원형편파(circular polarization)가 있다. 선형편파는 전자기파의 전기장이 특정 축을 따라 한 방향으로만 진동하는 경우이며, 지표면에 평행한 방향으로 진동하는 수평편파(H)와 지표면에 수직한 방향으로 진동하는 수직편파(V)로 구분된다. 일반적인 다중편파 SAR는 2가지 선형편파를 조합한다. 위에서 언급한 XX, XY, YX, YY 4가지 편파모드를 HH(수평송신/수평수신) 편파, HV(수평송신/수직수신) 편파, VH(수직송신/수평수신) 편파, VV(수직송신/수직수신) 편파로 나타낼 수 있다. 한편, 원형편파는 전기장이 진행방향에 수직한 원의 궤적을 그리는 형태이며 회전방향에 따라 우선회 원형편파(R)와 좌선회 원형편파(L)로 구분된다. 원형편파를 사용하는 혼합 4중편파 SAR (hybrid quadrature polarimetric SAR)[9],[10]는 선형편파와 조합하여 RH(우선회 원형송신/수평수신) 편파, RV(우선회 원형송신/수직수신) 편파, LH(좌선회 원형송신/수평수신) 편파, LV(좌선회 원형송신/수직수신) 편파가 존재한다.

일반적인 다중편파 SAR의 송신 전기장과 수신 전기장 사이의 관계식은 다음과 같다[11].

E r = ( E H r E V r ) = exp ( j k R ) R S E t = exp ( j k R ) R ( S H H S V H S H V S V V ) ( E H t E V t )
(1)

Et은 송신 전기장 벡터, Er은 수신 전기장 벡터이고, j는 허수, k는 파수(wave number), R는 관심영역과의 직선거리(slant range)이다. S는 산란 행렬이며 S의 요소들은 복소수 진폭(magnitude)으로 표현된다. Spq로 나타낼 때, p는 송신편파, q는 수신편파이다. 송신 전자기파가 상보성 매질(reciprocal medium)에서 산란되어 돌아오는 경우, 산란 행렬 S는 상보성 정리(reciprocity theorem)에 의해 복소 대칭 행렬이 되며, 다음을 만족한다[12].

S V H = S H V
(2)

산란 행렬 S는 다음의 식으로 표현할 수 있다.

S = k = 1 N α k S k
(3)

식 (3)에서 S는 산란행렬, Sk는 산란행렬의 기저, αkSk의 계수이다. 산란행렬 S를 구성하는 편파모드가 다양해질수록 기저의 수가 증가하므로, 표현 가능한 공간이 확장되어 관심영역에 대한 정보가 더욱 풍부해진다.

본 논문에서는 다중편파 SAR의 특성을 이용하여, 다중편파 기저를 변환함으로써 새로운 편파모드를 획득한다. 일반적인 다중편파는 수평편파와 수직편파를 반복적으로 송신하고, 수평편파와 수직편파를 동시에 수신한다. 반면 혼합 4중편파 SAR는 좌선회 원형편파와 우선회 원형편파를 주기적으로 송신하고, 수평편파와 수직편파를 동시에 수신한다. 일반적인 다중편파의 기저를 혼합 4중편파의 기저로 변환하는 식은 식 (4)와 같다[11].

( S H H S V H S H V S V V ) = ( S R H S L H S R V S L V ) 1 2 j 2 1 2 j 2
(4)

식 (4)에서 Spqp = {H,V,R,L}, q = {H,V} 이며, H는 수평편파, V는 수직편파, R은 우선회 원형편파, L은 좌선회 원형편파이다. 일반적인 다중편파 SAR에서 획득한 관심영역의 정보를 활용하여 선형변환을 통해 혼합 4중편파 SAR의 기저를 획득한다. 이를 통해 새로운 편파정보를 확보하여, 관심영역의 더욱 풍부한 정보를 얻을 수 있다.

식 (4)를 통해 일반적인 다중편파 SAR의 기저를 변환하여 LH 편파모드의 SAR 영상을 획득할 수 있다. 상보성 정리가 충족될 경우, 산란행렬 S는 복소 대칭 행렬이므로 VH 편파모드로 획득한 영상과 HV 편파모드로 획득한 영상은 동일하다. 식 (4)로부터 LH 편파모드에 대한 식을 (5)와 같이 정리할 수 있다.

S L H = S H H + j S V H = S H H + j S H V
(5)

따라서 식 (5)를 이용하여 HH 및 HV 편파모드 SAR 영상을 기반으로 LH 편파모드 SAR 영상을 획득할 수 있다.

2-2 CNN 주요 모델

인공지능은 인간의 사고와 의사결정 과정을 모방하여 자율적으로 작업을 수행하는 기술로, 여러 접근법 중 딥러닝이 주목받고 있다. 딥러닝은 다층 신경망 구조를 통해 대규모 데이터로부터 복잡한 패턴과 규칙을 자동으로 학습하며, 고차원 데이터를 처리하는 데 탁월한 성능을 발휘한다. 영상 처리 분야에서는 CNN이 대표적인 딥러닝 모델로, 합성곱 연산을 통해 영상의 다양한 지역적 특징을 효과적으로 학습한다. CNN은 영상 분류, 객체 탐지 등에서 널리 활용되고 있다.

CNN 구조는 지속적인 연구를 통해 다양한 파생 모델이 제안되었다. ResNet[13]은 잔여 학습(residual learning)을 도입하여 신경망이 학습하려는 목표 매핑(desired underlying mapping)을 입력과의 차이인 잔여 함수(residual function)로 재구성하였다. 이를 통해 깊은 신경망에서도 최적화가 용이해지며, 효율적인 학습이 가능하다. ResNeXt[14]는 그룹화된 합성곱(grouped convolution)을 통해 입력 채널을 여러 개의 작은 그룹으로 나누고, 각 그룹에서 독립적인 합성곱 연산을 수행한다. 이는 기존의 합성곱 방식보다 연산량을 줄이면서도 성능을 개선시킬 수 있다. DenseNet[15]은 각 층에서 이전 모든 층의 특징 맵을 연결(concatenation)하여 입력으로 받는 구조를 가진다. 이를 통해 특징 재사용(feature reuse)을 함으로써 효율적인 학습과 성능 향상이 이루어진다. EfficientNet[16]은 신경망의 너비, 깊이, 해상도를 균형 있게 확장하는 방식(compound scaling)이 제안되었다. 제한된 자원 내에서 계산 효율성과 모델 성능 개선을 동시에 달성하도록 고안되었다.

본 연구에서는 이러한 CNN 모델들을 활용하여 선박 및 빙산 SAR 영상 이진분류 실험을 진행하였고 각 모델의 성능을 평가하였다.

III. 실험 환경 및 성능 평가

3-1 선박 및 빙산 SAR 영상 이진분류

II장에서 일반적인 다중편파 SAR의 기저를 선형변환하여 혼합 4중편파 SAR의 기저를 얻는 방법을 다루었으며, 영상을 분류하는 데 사용되는 다양한 CNN 모델들을 살펴보았다. 이를 바탕으로, 주어진 선박 및 빙산 SAR 영상으로부터 다중편파 SAR의 기저를 변환하여 기존과 다른 편파모드의 SAR 영상을 얻는다. 기존 데이터셋에서 신규로 획득한 편파모드 SAR 영상을 포함하는 데이터셋을 구축하고, 분류 성능 개선 여부를 평가하였다. 분류 알고리즘으로 SVM과 다양한 CNN 모델들을 사용하여 성능을 비교 분석하였다.

3-2 캐글(Kaggle) 공개 데이터셋

다중편파 SAR의 특성을 이용하여 이진분류 성능이 개선되는 것을 확인하기 위해 캐글의 공개 데이터셋을 사용하였다[17]. 본 데이터셋은 Sentinel-1 위성으로 촬영한 선박과 빙산의 SAR 영상으로, HH 및 HV 편파모드만 존재한다. 레이블(label)이 주어진 데이터는 선박 851개와 빙산 753개로 구성되어 있으며, 각 편파모드에서 1,604개씩 제공된다. 각각의 영상 크기는 75 75이며, 픽셀 값은 dB(decibel) 단위의 실수로 표현한다.

그림 2그림 3의 (a)와 (b)는 데이터셋에서 선박 및 빙산 표본의 HH 및 HV 편파모드의 SAR 영상을 도시한 것이다. 동일한 표본이라도 편파모드가 달라짐에 따라 SAR 영상의 산란점 분포의 차이가 있음을 확인할 수 있다. 그림 2 (c)그림 3 (c)식 (5)를 통해 HH 및 HV 편파모드의 기저를 변환하여 LH 편파모드 SAR 영상을 획득한 것이다. 동일한 표본에 대하여 LH 편파모드의 SAR 영상 또한 HH 및 HV 편파모드의 SAR 영상과 산란점 분포의 차이를 확인할 수 있다.

jkiees-36-5-490-g2
그림 2. | Fig. 2. 선박 표본 SAR 영상 및 변환편파 SAR 영상 | Ship sample original & transformed SAR image.
Download Original Figure
jkiees-36-5-490-g3
그림 3. | Fig. 3. 빙산 표본 SAR 영상 및 변환편파 SAR 영상 | Iceberg sample original & transformed SAR image.
Download Original Figure
3-3 실험 환경 및 세부사항

실험을 통해 SVM과 다양한 CNN 모델의 다양한 분류기를 구축하여 선박 및 빙산 SAR 영상의 분류 성능을 평가하였다. 또한, 다중편파 SAR의 특성으로 획득한 편파모드 데이터를 기존 데이터셋에 포함하여 선박과 빙산의 이진분류 성능 개선을 확인하였다.

실험의 주요 내용은 다음과 같다. 기존에 주어진 HH 및 HV 편파모드의 데이터셋과 다중편파 SAR의 기저 변환으로 얻은 LH 편파모드 데이터를 포함한 데이터셋에 대해 각각 이진분류를 진행하였다. HH 및 HV 편파모드 데이터는 총 3,208개이며, HH와 HV 및 LH 편파모드 데이터는 총 4,812개이다. 딥러닝 모델 학습 및 평가에 쓰이기 위한 데이터셋의 학습, 검증, 평가 비율을 8:1:1로 구축하였다. 모든 데이터는 표준화를 진행하여 전처리를 수행하였다. 이진분류를 수행하는 SVM은 scikit-learn 라이브러리를 활용하였다. SVM의 하이퍼파라미터로는 정규화 계수(regularization parameter, C)를 10, 커널 함수(kernel function)를 RBF, 커널 계수(kernel coefficient, γ)를 0.001로 설정하였다. CNN은 PyTorch 내장 모듈을 사용하여 사전학습되지 않은 상태로 구현하였다. 최적화 알고리즘은 Adam, 학습률(learning rate)은 10−3, 배치크기(batch size)는 32로 설정하였다.

그림 4그림 5의 (a)와 (b)는 ResNet-50 구조를 사용하여 학습 및 검증 데이터셋의 손실값(loss) 및 정확도(accuracy)에 대한 학습곡선(learning curve)을 나타낸 것이다. 손실값은 예측값과 실제 레이블 간의 차이를 나타내며, 이진 교차 엔트로피(binary cross entropy)를 손실 함수(loss function)로 사용하여 계산하였다. 정확도는 각 데이터셋에 대해 모델이 정확하게 예측한 비율을 의미하며, 학습 데이터셋과 검증 데이터셋에 대한 각각의 정확도를 나타내었다. 그림 4는 기존에 제공된 HH 및 HV 편파모드 데이터셋의 학습곡선이며, 그림 5는 기존편파 데이터셋에 LH 변환 편파모드 데이터를 포함한 학습곡선이다. 본 실험에서는 사전에 100 에폭(epoch)까지 학습곡선을 확인하고, 학습 조기 종료(early stopping) 시점을 결정하였다. 학습 초반에는 훈련 손실값과 함께 검증 손실값도 지속적으로 감소하여 분류 학습이 원활하게 이루어짐을 확인할 수 있다. 그러나 학습이 진행될수록 검증 손실 값의 감소 폭이 줄어들었으며, 일정 시점 이후에는 훈련 손실값과 검증 손실값 간의 차이가 벌어지는 과적합(overfitting)현상이 관찰되었다. 정확도 학습곡선에서도 초기에는 검증 정확도가 함께 상승하지만, 이후 일정 구간부터는 성능 개선이 정체되는 경향을 보인다. 본 실험의 성능 평가를 위한 CNN 모델 학습에서는 충분히 학습이 진행된 것으로 판단되는 에폭 중, 51번째 에폭부터 모델 파라미터를 저장하였다. 이후, 학습이 10 에폭 진행되는 동안 검증 손실값이 개선이 되지 않으면 조기 종료를 적용하였다.

jkiees-36-5-490-g4
그림 4. | Fig. 4. ResNet-50 모델을 사용해 기존편파(HH, HV) SAR 데이터셋으로 얻은 학습곡선 | Learning curves obtained from the original polarization (HH, HV) SAR dataset using ResNet-50 model.
Download Original Figure
jkiees-36-5-490-g5
그림 5. | Fig. 5. ResNet-50 모델을 사용해 기존편파(HH, HV) 및 변환편파(LH) SAR 데이터셋으로 얻은 학습곡선 | Learning curves obtained from the original (HH, HV) & transformed (LH) polarization SAR dataset using ResNet-50 model.
Download Original Figure

그림 6그림 4그림 5의 학습곡선 중 검증 손실값 및 검증 정확도를 하나의 그래프로 통합하여 나타낸 것이다. 그림 6을 통해 변환편파 데이터를 포함한 데이터셋으로 학습한 경우가 기존 데이터셋만을 학습한 경우보다 검증 손실값이 낮고 검증 정확도가 높은 경향을 보이며, 이를 통해 분류 성능이 더 우수함을 확인할 수 있었다.

jkiees-36-5-490-g6
그림 6. | Fig. 6. 기존편파(HH, HV) SAR 데이터셋과 변환편파(LH)를 포함한 SAR 데이터셋의 검증 성능 비교 | Comparison of validation performance between the original polarization (HH, HV) SAR dataset and the dataset with the included transformed polarization (LH).
Download Original Figure
3-4 성능 평가 및 결과

다양한 분류기를 사용하여 평가 데이터셋에 대한 정밀도(precision), 재현율(recall), F1-score, 정확도를 확인하고, 이를 기반으로 분류 성능을 평가하였다. 정밀도는 모델이 양성(positive)으로 예측한 데이터 중에서 실제로 양성인 비율을 나타낸다. 재현율은 실제로 양성인 데이터 중에서 모델이 양성으로 예측한 비율을 의미한다. 본 실험에서 양성을 선박으로 설정하여 정밀도와 재현율을 측정하였다. F1-score는 정밀도와 재현율의 조화 평균으로 클래스 간의 데이터가 불균형할 경우 모델의 성능을 평가하는 데 유용하다. 단일 실험에서 발생할 수 있는 편향을 줄이기 위해 몬테카를로 시뮬레이션을 10회 수행하였으며, 각 실험에서 얻은 성능 평가 지표의 평균값을 계산하여 모델의 전반적인 성능을 평가하였다.

표 1은 기존의 데이터셋만을 활용하여 SVM과 CNN(ResNet-50)의 분류 성능을 나타낸다. 표 2는 변환된 편파모드 데이터를 기존 데이터셋에 포함하여 SVM과 CNN(ResNet-50)의 분류 성능을 비교한 것이다. 표 1표 2를 통해 SAR 영상 이진분류에서 CNN 모델이 SVM보다 모든 성능 지표에서 우수한 결과를 보임을 확인하였다. 또한, CNN 모델과 SVM 모두 변환된 편파모드 데이터를 포함함으로써 분류 성능이 향상되었다. 표 3은 기존의 데이터셋과 변환된 편파모드 데이터가 포함된 데이터셋을 활용하여, 다양한 CNN 모델의 이진분류 성능을 비교한 결과를 나타낸다. 본 실험 환경에서 기존 데이터셋만 분류했을 때 DenseNet-121 모델이 정밀도, F1-score, 정확도 지표에서 가장 우수한 성능을 보였다. 기존 데이터셋에 변환된 편파모드 데이터를 포함한 경우, ResNet-34 모델의 F1-score와 정확도 지표에서 가장 우월한 성능을 나타냈다. 또한, 기존 데이터셋을 기반으로 학습된 CNN 모델 간 정확도는 약 79~84 %이고, 변환된 편파모드 데이터가 포함된 데이터셋에서는 약 89~90 %로 관측되었다. 변환된 편파모드 데이터를 포함한 경우, 기존 데이터셋만 사용한 것보다 평균적으로 약 8 %의 정확도가 향상되었다. 표 3을 통해, CNN 모델을 변경하는 것보다 다중편파 SAR의 특성을 활용하여 획득한 LH 편파모드 SAR 영상을 포함하는 데이터셋이 성능 개선에 더 큰 영향을 미친다는 것을 확인할 수 있다.

표 1. | Table 1. 기존편파(HH, HV) SAR 데이터셋의 SVM 및 CNN 이진분류 성능 비교 | Comparison of binary classification performance between SVM and CNN using original polarization (HH, HV) SAR dataset.
Classifier Precision (%) Recall (%) F1-score (%) Accuracy (%)
SVM 79.39 71.20 75.07 72.90
ResNet-50 89.45 79.24 83.97 82.71
Download Excel Table
표 2. | Table 2. 기존편파(HH, HV) 및 변환편파(LH) SAR 데이터셋의 SVM 및 CNN 이진분류 성능 비교 | Comparison of binary classification performance between SVM and CNN using original (HH, HV) & transformed polarization (LH) SAR dataset.
Classifier Precision (%) Recall (%) F1-score (%) Accuracy (%)
SVM 83.59 84.23 83.91 82.57
ResNet-50 92.24 89.27 90.70 90.15
Download Excel Table
표 3. | Table 3. 기존편파 SAR 데이터셋(HH, HV)과 변환편파(LH)데이터가 포함된 데이터셋을 활용하여 다양한 CNN 모델의 이진분류 성능 비교 | Comparison of various CNN Models for binary classification performance using original polarization (HH, HV) SAR dataset and the dataset with the included transformed polarization (LH).
Dataset Classifier Precision(%) Recall (%) F1-score(%) Accuracy(%)
Original ResNet-18 87.81 82.99 85.27 83.58
Origin+LH 93.23 88.23 90.65 90.19
Original ResNet-34 87.81 81.63 84.51 82.90
Origin+LH 93.01 89.62 91.25 90.73
Original ResNet-50 89.45 79.24 83.97 82.71
Origin+LH 92.24 89.27 90.70 90.15
Original ResNeXt-50 (32×4d) 89.14 80.00 84.20 82.87
Origin+LH 92.55 89.15 90.81 90.27
Original DenseNet-121 90.63 81.30 85.66 84.42
Origin+LH 92.16 89.69 90.89 90.31
Original DenseNet-161 89.71 80.00 84.49 83.21
Origin+LH 93.12 87.50 90.21 89.75
Original EfficientNet-b0 85.11 77.99 81.36 79.53
Origin+LH 92.45 88.15 90.22 89.71
Original EfficientNet-b1 87.15 80.00 83.35 81.71
Origin+LH 92.80 88.42 90.54 90.04
Download Excel Table

IV. 결 론

본 연구에서는 다중편파 SAR의 특성과 딥러닝을 활용하여 선박과 빙산의 이진분류 성능을 개선하는 접근법을 제시하였다. 일반적인 다중편파 SAR의 기저 변환을 통해 혼합 4중편파 SAR 기저를 획득할 수 있으며, 기존에 제공된 HH 및 HV 편파모드 SAR 영상으로부터 합성 변환된 LH 편파모드 SAR 영상을 확보할 수 있다. 선박 및 빙산 이진분류 실험 결과를 통해, 합성변환된 편파모드 SAR 영상을 포함한 데이터셋이 기존 편파모드만 활용한 데이터셋보다 더 우수한 분류 성능을 보임을 입증하였다. 이는 다중편파 SAR의 변환이 이진분류 성능을 개선시키는 유효한 방법임을 시사한다.

본 연구에서 전통적인 머신러닝 알고리즘인 SVM과 딥러닝 모델인 CNN에 대해 동일한 데이터셋을 기준으로 성능을 비교한 결과, CNN 모델이 SAR 영상 이진분류 작업에서 더 우수함을 확인하였다. 또한, CNN 모델을 변경하는 것보다 다중편파 SAR의 특성을 활용하여 합성 변환된 LH 편파모드 SAR 영상을 기존 데이터셋에 포함하였을 때 분류 성능이 더 크게 개선됨을 관찰하였다.

Acknowledgements

이 논문은 2024년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(No. 2021R1I1A3043152).

References

[1].

M. S. Kang, J. M. Baek, “Compressive sensing-based Omega-K algorithm for SAR focusing,” IEEE Geoscience and Remote Sensing Letters, vol. 22, p. 4003405, Jan. 2025.

[2].

M. S. Kang, J. M. Baek, “Effective denoising of InSAR phase images via compressive sensing,” IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, vol. 17, pp. 17772-17779, May 2024.

[3].

M. S. Kang, J. M. Baek, “SAR image reconstruction via incremental imaging with compressive sensing,” IEEE Transactions on Aerospace and Electronic Systems, vol. 59, no. 4, pp. 4450-4463, Aug. 2023.

[4].

M. S. Kang, J. M. Baek, “Efficient SAR imaging integrated with autofocus via compressive sensing,” IEEE Geoscience and Remote Sensing Letters, vol. 19, p. 4514905, Oct. 2022.

[5].

M. S. Kang, K. T. Kim, “Automatic SAR image registration via Tsallis entropy and iterative search process,” IEEE Sensors Journal, vol. 20, no. 14, pp. 7711-7720, Jul. 2020.

[6].

M. S. Kang, K. T. Kim, “Ground moving target imaging based on compressive sensing framework with single-channel SAR,” IEEE Sensors Journal, vol. 20, no. 3, pp. 1238-1250, Feb. 2020.

[7].

M. S. Kang, K. T. Kim, “Compressive sensing based SAR imaging and autofocus using improved Tikhonov regularization,” IEEE Sensors Journal, vol. 19, no. 14, pp. 5529-5540, Jul. 2019.

[8].

C. Cortes, V. Vapnik, “Support-vector networks,” Machine Learning, vol. 20, pp. 273-297, Sep. 1995.

[9].

R. K. Raney, “Hybrid-quad-pol SAR,” in IGARSS 2008-2008 IEEE International Geoscience and Remote Sensing Symposium, Boston, MA, Jul. 2008, pp. IV-491-IV-493.

[10].

P. Li, F. Zhao, D. Liu, N. Ou, C. Cao, and X. Liu, et al., “First demonstration of hybrid quad-pol SAR based on P-band airborne experiment,” IEEE Transactions on Geoscience and Remote Sensing, vol. 60, p. 5209016, Jun. 2021.

[11].

M Villano, G Krieger, and A Moreira, “New insights into ambiguities in quad-pol SAR,” IEEE Transactions on Geoscience and Remote Sensing, vol. 55, no. 6, pp. 3287-3308, Jun. 2017.

[12].

S. R. Cloude, K. P. Papathanassiou, “Polarimetric SAR interferometry,” IEEE Transactions on Geoscience and Remote Sensing, vol. 36, no. 5, pp. 1551-1565, Sep. 1998.

[13].

K. He, X. Zhang, S. Ren, and J. Sun, “Deep residual learning for image recognition,” in 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR), Las Vegas, NV, Jun. 2016, pp. 770-778.

[14].

S. Xie, R. Girshick, P. Dollár, Z. Tu, and K. He, “Aggregated residual transformations for deep neural networks,” in 2017 IEEE Conference on Computer Vision and Pattern Recognition(CVPR), Honolulu, HI, Jul. 2017, pp. 1492-1500.

[15].

G. Huang, Z. Liu, L. van der Maaten, and K. Q. Weinberger, “Densely connected convolutional networks,” in 2017 IEEE Conference on Computer Vision and Pattern Recognition(CVPR), Honolulu, HI, Jul. 2017, pp. 4700-4708.

[16].

M. Tan, Q. Le, “Efficientnet: Rethinking model scaling for convolutional neural networks,” in Proceedings of the 36th International Conference on Machine Learning, Long Beach, CA, Jun. 2019, pp. 6105-6114.

[17].

Kaggle Competition. “Statoil/C-CORE iceberg classifier challenge,” 2018. Available: https://www.kaggle.com/competitions/statoil-iceberg-classifier-challenge/data

Notes

채 승 병 [국립공주대학교/석사과정]

jkiees-36-5-490-i1

  • https://orcid.org/0009-0007-8340-077X

  • 2015년 2월: 아주대학교 전자공학과 (공학사)

  • 2024년 3월~현재: 국립공주대학교 전기전자제어공학부 석사과정

  • [주 관심분야] 레이다 신호처리, 레이다 영상 활용, 딥러닝

강 민 석 [국립공주대학교/부교수]

jkiees-36-5-490-i2

  • https://orcid.org/0000-0002-7021-6873

  • 2013년 2월: 아주대학교 전자공학과 (공학사)

  • 2015년 2월: 포항공과대학교 전자전기공학과 (공학석사)

  • 2019년 2월: 포항공과대학교 전자전기공학과 (공학박사)

  • 2019년 3월~2020년 8월: 국방과학연구소 선임연구원

  • 2020년 9월~2024년 8월: 국립공주대학교 전기전자제어공학부 조교수

  • 2024년 9월~현재: 국립공주대학교 전기전자제어공학부 부교수

  • [주 관심분야] 레이다 신호 및 영상처리, 레이다 영상 활용, 배열 안테나 합성 및 빔 패턴 최적화, 최적화 이론 및 압축센싱 응용, 딥러닝