Data-Driven Approach for Wideband Frequency-Invariant Beamforming

Chang, Jaewon; Kim, Seon Kyo; Park, Cheol Sun

doi:10.5515/KJKIEES.2026.37.5.452

J. Korean Inst. Electromagn. Eng. Sci. 2026; 37(5):452-461

pISSN: 1226-3133, eISSN: 2288-226X

DOI: https://doi.org/10.5515/KJKIEES.2026.37.5.452

논문/REGULAR PAPERS

광대역 주파수 불변 균일빔 생성을 위한 데이터 기반 접근법

장재원^†

, 김선교

, 박철순

Data-Driven Approach for Wideband Frequency-Invariant Beamforming

Jaewon Chang^†

, Seon Kyo Kim

, Cheol Sun Park

Author Information & Copyright ▼

^{국방과학연구소}

^{Agency for Defense Development}

^†Corresponding Author: Jaewon Chang (e-mail: jaewon2834@gmail.com)

© Copyright 2026 The Korean Institute of Electromagnetic Engineering and Science. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Dec 08, 2025; Revised: Dec 22, 2025; Accepted: Mar 05, 2026

Published Online: May 31, 2026

요 약

본 논문은 광대역 배열 안테나 시스템에서 주파수 변화에 따라 빔폭이 변하는 빔 스퀀트(beam squint) 현상을 억제하고, 주파수 불변(frequency-invariant) 특성을 갖는 균일빔을 생성하기 위한 데이터 기반 설계 접근법을 제안한다. 제안하는 프레임워크는 지도 학습(supervised learning), 비지도 학습(unsupervised learning), 강화 학습(reinforcement learning)의 세 가지 머신러닝 모델을 활용하여, 수신 성능을 극대화하면서도 전 대역에서 일정한 빔폭을 유지하는 최적의 가중치 벡터를 산출한다. 특히 시뮬레이션 데이터로 사전 학습된 모델을 실제 야외 방사 테스트에서 획득하여 보정한 데이터로 미세 조정(fine-tuning)함으로써, 하드웨어의 불완전성과 실제 채널 환경에서도 강인한 성능을 확보하였다. 성능 분석을 위하여 목표 균일 빔폭 20° 에 대해 반전력 빔폭의 평균 제곱근 오차를 통하여 주파수 불변성을 입증하고, 비트 오류율 분석을 통해 LCMV(linearly constrained minimum variance) 빔포머와 유사한 수신 성능을 유지함을 확인하였다.

Abstract

This paper proposes a data-driven design approach for generating wideband frequency-invariant uniform beams to mitigate the beam squint phenomenon, where beamwidth varies with frequency in antenna array systems. The proposed framework utilizes three machine learning models—supervised learning, unsupervised learning, and reinforcement learning—to derive optimal weight vectors that maintain a constant beamwidth across the entire operating band while maximizing reception performance. In particular, robustness against hardware imperfections and real-world channel environments is secured by pre-training the models with simulation data and subsequently fine-tuning them using calibrated data acquired from outdoor radiation tests. For performance analysis, frequency invariance is validated through the root mean square error of the half-power beamwidth with respect to a target uniform beamwidth of 20°. Furthermore, bit error rate analysis confirms that the proposed method maintains reception performance comparable to the theoretical Linearly Constrained Minimum Variance (LCMV) beamformer.

Keywords: Wideband Beamforming; Frequency Invariant; Beam Squint; Deep Learning; Reinforcement Learning

I. 서 론

광대역 통신, 차세대 레이다, 전자전(EW: electronic warfare), 신호 정보(SIGINT: signal intelligence)와 같은 다양한 응용 분야에서는 광대역 주파수 범위에 걸쳐 일관된 시스템 성능을 유지하는 것은 매우 중요하다^[1]. 안테나 배열을 사용하는 수신기 시스템에서, 일관된 공간 필터링 능력과 수신 감도를 보장하여 전체적인 신뢰성을 높이기 위해서는 주파수 변화와 관계없이 일정한 빔 폭과 이득을 유지하는 주파수 불변(frequency-invariant) 빔 패턴을 형성하는 것이 필요하다^[2].

그러나 고정된 기하학적 구조를 갖는 기존 배열 시스템은 물리적 제약으로 인해, 주파수가 높아질수록 유효 개구면이 확장되어 빔 폭이 좁아지는 현상이 발생한다. 빔 스퀸트(beam squint)라 불리는 이 현상은 광대역 신호 수신 시 공간적 왜곡을 일으키며, 특정 대역에서 원치 않는 간섭을 허용하거나 목표 신호의 수신 품질을 저하시키는 원인이 된다^[3]. 이를 해결하기 위해 중첩 배열(nested arrays)^[4], 로그-주기 배열^[5], 필터-합계 빔포머^[6] 등의 기법이 제안되었으나, 하드웨어 복잡도 증가나 제한적인 운용 대역폭 등의 한계가 존재한다. 또한, GSC(generalized sidelobe canceller)^[7]나 부대역 처리 기법^[8]과 같은 해석적 접근 방식은 이상적인 채널 환경을 가정하므로, 상호 결합(mutual coupling)이나 소자 위치 오차 등 비선형적 왜곡이 존재하는 실제 하드웨어 환경에서는 성능이 제한될 수 있다.

최근 복잡한 최적화 문제를 해결하기 위한 대안으로 머신러닝이 대두되고 있으나^[9],[10], 대부분의 연구는 협대역 환경에 국한되어 있다. 특히 시뮬레이션 환경에서 학습된 모델을 실제 환경에 적용할 때 발생하는 도메인 격차(domain gap)를 해소하는 것은 광대역 빔포밍 분야의 주요 난제이다.

이에 본 논문에서는 광대역 안테나 시스템의 빔 스퀸트 현상을 억제하고, 하드웨어 불완전성이 존재하는 실제 환경에서도 강인한 주파수 불변 균일빔을 생성하기 위한 데이터 기반 설계 프레임워크를 제안한다. 제안하는 기법은 지도 학습(SL: supervised learning), 비지도 학습(UL: unsupervised learning), 강화 학습(RL: reinforcement learning) 모델을 포괄적으로 활용하며, 시뮬레이션 데이터로 사전 학습(pre-training)된 모델을 실제 야외 방사 테스트 데이터로 미세 조정(fine-tuning)하는 전이 학습 기법을 적용하여 실용성을 극대화하였다.

본 논문의 구성은 다음과 같다. II절에서는 시스템 모델과 시뮬레이션 및 실제 데이터 획득 과정을 설명하고, III절에서는 제안하는 세 가지 학습 모델(SL, UL, RL)의 구조와 학습 방법을 상세히 기술한다. IV절에서는 시뮬레이션 및 야외 실험 결과를 통해 제안 기법의 성능을 이론적 LCMV(linearly constrained minimum variance) 빔포머와 비교 분석하며, 마지막으로 V절에서 결론을 맺는다.

II. 시스템 모델 및 데이터 획득

본 논문에서는 광대역 스펙트럼에서 작동하도록 설계된 N_r개의 안테나 소자를 갖춘 수신기 시스템을 고려한다. 핵심 과제는 이 N_r개 소자로부터의 신호를 처리하여 주파수 변화와 무관하게 일관된 빔 패턴을 형성하는 것이다. 기계 학습의 성공적인 적용은 훈련 데이터의 품질과 구조에 결정적으로 의존한다. 본 절에서는 제안된 모델의 훈련 및 검증에 사용되는 데이터 생성 및 보정 프레임워크를 설명한다.

2-1 시뮬레이션 데이터 생성

초기 모델 훈련을 위해 충분히 크고 다양한 데이터셋을 확보하기 위해, 먼저 시뮬레이션 된 훈련 샘플을 생성한다^[11]. 가능한 모든 환경 조건을 포괄하는 포괄적인 실제 신호 세트를 수집하는 것은 비현실적이기 때문에 이 과정은 필수적이다. N_r개의 안테나 소자, N_f개의 이산 주파수 빈, N_θ개의 잠재적 도달 각도(DOA : direction of arrival)를 나타내는 N_r×N_f×N_θ차원의 시뮬레이션 데이터 큐브가 생성된다. 이 훈련 샘플들은 무작위 신호의 도래 방위각, 다양한 간섭원 및 다양한 잡음 레벨을 고려하여 광범위하게 시뮬레이션된 신호 대 간섭 잡음비(SINR: signal to interference plus noise ratio) 조건하에서 생성된다.

2-2 실환경 보정 및 미세 조정

시뮬레이션 데이터와 실환경에서의 수집 데이터 사이의 간극을 메우고 모델이 하드웨어적 불완전성 및 실제 채널 효과에 강인하도록 보장하기 위해, 보정 및 미세 조정 과정이 필수적이다^[12].

첫째, 내부 보정 절차가 수행된다. 보정 신호 생성기가 작동 대역 전반에 걸쳐 알려진 진폭과 위상의 신호를 주입한다. 수신기는 N_f개의 주파수 지점에서 N_r개 각 채널의 채널별 오프셋을 측정하고, 결과를 N_r×N_f 차원의 보정 데이터 행렬에 저장한다. 이 행렬은 이후 수신되는 모든 신호를 보정하여 채널 간 불일치를 최소화하는 데 사용된다.

둘째, 이렇게 보정된 실제 신호가 수집된다. 다중 경로 페이딩 및 주변 간섭과 같은 환경적 영향을 본질적으로 포함하는 이 샘플들은 사전 훈련된 기계 학습 모델을 미세 조정(fine-tuning)하는 데 사용된다. 시뮬레이션 데이터로 사전 훈련하고 보정된 실제 데이터로 미세 조정하는 접근 방식은 강인하고 실용적인 시스템을 개발하는 데 매우 중요하다. 전이 학습(transfer learning)과 같은 기술이 사전 훈련된 모델을 새롭거나 동적인 작동 환경에 효율적으로 적응시키는 데 사용될 수 있다^[13].

III. 광대역 주파수 불변 균일빔 생성

기존 빔포밍 수신기의 출력은 가중치 벡터 w가 적용되는 선형 연산이다. 선형 제약 최소 분산(LCMV) 알고리즘은 원하는 신호 방향으로 빔을 조향하면서 특정 간섭 방향으로 널(null)을 위치시킬 수 있기 때문에 이러한 가중치를 결정하는 데 자주 사용된다^[14].

본 연구에서는 시스템 모델을 주파수 영역에서 정의한다. 주어진 방위각 θ와 주파수 f에 대한 배열 조향 벡터(steering vector)를 $a (θ, f) ∈ ℂ N r$ 이라 하자. 소자 간격이 d인 등간격 선형 배열(ULA: uniform linear array)의 경우, n번째 소자의 응답은 식 (1)과 같이 정의된다.

[a (θ, f)] n = e j 2 π f c (n − 1) d sin θ

(1)

주파수 f에서의 수신 신호 벡터 $x (f) ∈ ℂ N r$ 은 식 (2)와 같다.

x (f) = a θ s, f s (f) + ∑ k = 1 N int a θ k, f i k (f) + n (f)

(2)

여기서 θ_s와 θ_k는 각각 원하는 신호와 k번째 간섭 신호의 방위각 정보이고, N_int 는 간섭 신호의 수이며, s(f), i_k(f), n(f)는 각각 신호, 간섭, 잡음의 주파수 영역 표현이다. 빔포머 출력은 y(f)=w^Hx(f)로 주어지며, 여기서 w는 우리가 찾고자 하는 단일의 주파수 불변 균일빔 가중치 벡터이다. 결과적인 전력 빔 패턴은 식 (3)과 같다.

B θ, f w = w H a (θ, f) 2

(3)

광대역 주파수 불변 균일 빔포밍의 목표는 모든 f∈[f_min,f_max]에 대해 빔 패턴 B(θ,f | w)가 일정하게 유지되는 단일 가중치 벡터 w를 찾는 것이다. 특정 주파수 f에서 신호 대 간섭 잡음비(SINR)를 최대화하는 LCMV 해는 식 (4)와 같다.

w LCMV (f) = R (f) − 1 C C H R (f) − 1 C − 1 f

(4)

여기서 $R (f) = E x (f) x H (f)$ 는 주파수 f에서의 공분산 행렬이다. 또한 C는 원하는 신호 방향과 널 방향에 해당하는 조향 벡터들로 구성된 제약 행렬이며, f는 각 방향에 대한 빔포머의 목표 이득을 정의하는 응답 벡터이다. 이와 같은 방법으로 얻어지는 가중치 벡터는 주파수에 의존적이므로, 이를 광대역 주파수 범위에 직접 적용하면 빔 스퀀트(beam squint) 현상이 발생한다. 본 논문은 기계 학습을 사용하여 단일의 최적 w를 생성함으로써 이러한 한계를 극복한다.

3-1 지도 학습(Supervised Learning)

본 절에서는 공동 손실(joint loss) 최적화 프레임워크를 사용하는 지도 학습 접근법을 제안한다(그림 1). 제안방식으로 생성되는 빔포머는 (1) 높은 SINR 성능과 (2) 주파수 불변 균일빔 형태라는 잠재적으로 상충하는 두 가지 목표를 동시에 만족시켜야 한다.

그림 1. | Fig. 1. 지도 학습 모델의 아키텍처 | Architecture of the supervised learning model.

Download Original Figure

지도 학습 모델은 4개의 1D 합성곱 층(1D-CNN)과 2개의 완전 연결(FC) 층으로 구성된 아키텍처를 가지며, 활성화 함수로는 GELU(Gaussian error linear unit)가 사용된다. 모델 f_NN (· ; Θ)은 환경 데이터 X(예: 중심 주파수에서의 공분산 행렬 R(f_c))를 입력으로 받아 최적의 주파수 불변 균일빔 가중치 벡터 ŵ을 예측한다. 이 모델은 성능 손실 함수 ℒ_PERF와 주파수 불변성 손실 함수 ℒ_FI의 가중 합인 총 손실 함수 ℒ_Total을 최소화함으로써 훈련된다.

3-1-1 성능 손실(ℒ_PERF)

이 손실 함수는 예측된 가중치가 높은 SINR을 달성하도록 유도한다. 기준 주파수 f_c에서의 최적 LCMV 가중치 w_ref,i=w_LCMV (R_i (f_c))를 목표값으로 사용하며, M개의 훈련 샘플에 대한 평균 제곱 오차(MSE: mean squared error)로 정의된다.

L PERF (Θ) = 1 M ∑ i = 1 M w ref, i − w^(Θ) 22

(5)

3-1-2 주파수 불변성 손실(ℒ_FI)

이 손실 함수는 빔 패턴이 주파수에 상관없이 일정하게 유지되도록 강제한다. 이는 N_f개의 주파수 샘플과 N_θ개의 각도 샘플에 걸쳐, 예측된 가중치 ŵ로 형성된 빔 패턴과 사전 정의된 목표 빔 패턴 B_t 사이의 오차를 최소화한다.

L FI (Θ) = 1 M N θ N f ∑ i = 1 M ∑ k = 1 N θ ∑ j = 1 N f w^i H a θ k, f j 2 − B t θ k 2

(6)

3-1-3 총 손실(ℒ_Total)

두 손실 함수는 정규화 파라미터 0≤α≤1을 사용하여 결합된다.

L Total (Θ) = (1 − α) L PERF (Θ) + α L F I (Θ)

(7)

파라미터 α는 수신 성능과 생성 빔폭의 주파수 균일성 간의 트레이드오프를 제어한다. α→0이면 모델은 SINR 성능을 우선시하여 주파수 변동성의 위험을 감수하며, α→1이면 SINR을 희생하더라도 일정한 빔 형태를 유지하는 것을 우선시한다.

3-2 비지도 학습(Unsupervised Learning)

비지도 접근법은 주로 고차원 입력 데이터를 특성화하는 데 사용된다(그림 2). 본 연구에서는 입력 신호 환경의 압축된 저차원 표현을 학습하기 위해 오토인코더(autoencoder)를 사용한다.

그림 2. | Fig. 2. 비지도 학습 분석을 위한 프레임워크 | Framework for the unsupervised learning analysis.

Download Original Figure

3-2-1 오토인코더 모델

오토인코더는 인코더 E(· ; Θ_E)와 디코더D(· ; Θ_D)로 구성된다. 인코더는 입력 X(예: 공분산 행렬 $R ∈ ℂ N r × N r$ )를 잠재 벡터 z=E(X ; Θ_E)로 매핑하고, 디코더는 z로부터 입력을 식 (8)과 같이 재구성한다.

X^= D z; Θ D = D E X; Θ E; Θ D

(8)

모델은 M개의 훈련 샘플에 대해 Frobenius norm을 사용하여 정의된 재구성 오류를 최소화함으로써 훈련된다.

L AE Θ E, Θ D = 1 M ∑ i = 1 M X i − X^i F 2

(9)

오토인코더 아키텍처는 인코더와 디코더 각각 2개의 FC 층으로 구성되며, GELU 활성화 함수를 사용한다.

3-2-2 잠재 공간 분석

훈련 후, 인코더 E(·)는 강력한 특징 추출기 역할을 한다. 훈련 데이터를 인코더에 통과시켜 얻은 잠재 벡터 z들은 t-SNE(t-distributed stochastic neighbor embedding)^[15]를 통해 시각화된다. 이 분석은 데이터의 기저 구조를 드러내어, 유사한 신호 환경(예: 특정 도래 방위각 또는 간섭 패턴)에 해당하는 클러스터를 식별하는 데 사용된다. 나아가, 훈련된 디코더 D(·)는 학습된 잠재 공간 내에서 샘플링하거나 보관함으로써 새로운 빔포밍 환경을 합성할 수 있는 생성 모델로 활용될 수 있다.

3-3 강화 학습(Reinforcement Learning)

강화 학습 프레임워크는 신경망 구조의 종류 및 하이퍼파라미터를 탐색하는 NAS(neural architecture search) 기법을 구현하기 위해 사용된다(그림 3). 이를 통해 학습형 모델이 주어진 데이터와 목적에 맞는 최적의 모델을 스스로 디자인하여 향상된 성능의 균일 합성빔 생성이 가능하다.

그림 3. | Fig. 3. 강화 학습 프레임워크 | Reinforcement learning framework.

Download Original Figure

본 연구에서는 최적의 신경망 구조 탐색 과정을 마르코프 결정 과정(MDP: Markov decision process)으로 모델링하며, 이는 상태(state), 행동(action), 보상(reward)으로 정의된다.

3-3-1 상태(State)

t 시점에서의 상태 S_t는 현재 선택된 하이퍼파리미터 조합 λ_t와 해당 모델의 검증 데이터셋 D_val에 대한 총 손실 값 ℒ_val(λ_t)으로 정의된다.

S t = λ t, L val λ t where L val λ t = L Total Θ ∗; D val

(10)

이때 Θ*는 하이퍼파라미터 λ_t를 적용하여 훈련 데이터셋으로 학습이 완료된 모델의 파라미터이며, D_val은 훈련 데이터와 상호 배타적(mutually exclusive)인 검증용 샘플들의 집합을 의미한다.

3-3-2 행동(Action)

에이전트(agent)는 현재 상태를 기반으로 탐색 공간 Λ 내에서 다음 시도할 하이퍼파라미터 조합 λ_t+1을 결정한다. 탐색 공간은 학습률, 커널 크기, 레이어 수 등을 포함한다.

A t = λ t + 1 ∈ Λ

(11)

3-3-3 보상(Reward)

보상은 에이전트가 선택한 행동이 목표 성능을 얼마나 만족시켰는지를 평가한다. 본 연구에서는 식 (7)에서 정의한 총 손실 함수 ℒ_Total의 음의 값을 보상으로 설정하여, 손실을 최소화하는 것이 보상을 최대화하는 것과 같도록 한다.

R t = − L Total λ t + 1

(12)

3-3-4 최적화(Optimization)

강화 학습의 목표는 누적 보상의 기댓값을 최대화하는 최적의 하이퍼파라미터 λ*를 찾는 것이다.

λ ∗ = arg max λ ∈ Λ E ∑ t γ t R t

(13)

여기서 γ는 할인 인자(discount factor)이다. 이러한 과정을 통해 모델은 주어진 데이터 환경에서 빔 패턴의 주파수 불변성과 SINR 성능을 동시에 극대화하는 최적의 네트워크 구조를 스스로 학습하게 된다. 실제 구현에서는 Optuna 라이브러리의 TPE(tree-structured Parzen estimator) 알고리즘^[16]을 사용하여 위 최적화 문제를 해결한다. 강화 학습의 ‘environment’는 전체 하이퍼파라미터 공간을 의미하고, ‘agent’는 최적의 파라미터를 탐색하는 신경망 모델 자체이며, 매 시행마다 도출된 결과값과 조합을 테스트하여 최적의 균일빔 성능을 획득한다.

IV. 성능 결과

제안된 기계 학습 프레임워크를 검증하기 위해, 모델링 및 시뮬레이션과 실제 야외 방사 시험을 모두 활용하여 광범위한 평가를 수행하였다. 실험 구성에는 관심 주파수 대역인 저대역, 중대역, 고대역을 모두 커버하도록 설계된 광대역 안테나 배열가 사용되었다. 그림 4에 나타난 바와 같이, 구조물 상단에 위치한 중/고대역 안테나는 기존의 균일 간격 배열(uniformly spaced array) 대신 스케일드 개구면(scaled aperture) 설계를 채택하였다. 균일빔 생성을 위한 실 데이터 획득 및 검증을 위하여 활용된 광대역 안테나 배열 테스트베드의 물리적 사양은 표 1과 같다.

그림 4. | Fig. 4. 실제 데이터 획득 및 검증에 사용된 광대역 안테나 배열 테스트베드 | The wideband antenna array testbed used for real-world data acquisition and validation.

Download Original Figure

표 1. | Table 1. 광대역 안테나 배열 테스트베드의 물리적 사양 | Physical specifications of the wideband antenna array testbed.

Category	Low band	Mid/High band
Number of antenna elements (units)	16	26
Element spacing (cm)	77	5
Receiver configuration	16-channel receiver and band selection switching module (custom-built)
Signal radiation environment	Open-field (using signal generator, transmitting antenna, and high-power amplifier)
Calibration method	Phase calibration via simultaneous branch injection of a single calibration source

Download Excel Table

모든 모델의 핵심 목표는 전체 운용 대역에 걸쳐 20°의 일정한 목표 반전력 빔폭을 유지하는 것이다. 성능은 20° 목표값에 대한 반전력 빔폭의 평균 제곱근 오차(RMSE: root mean square error)와 모의 수신 시나리오에서의 비트 오류율(BER: bit error rate)을 통해 정량화하였다.

제안된 데이터 기반 접근법의 하드웨어 효율성을 검증하기 위해 Intel Xeon 69226R CPU와 총 624 TFLOPs의 연산 능력을 보유한 2기의 NVIDIA A100 GPU 환경에서 분석을 수행하였다. 모든 모델은 역행렬 연산을 수행하는 기존 LCMV 기법과 달리, 학습된 단일 가중치 벡터를 즉각적으로 산출하여 연산 복잡도를 획기적으로 낮추었다. 표 2는 각 모델별 연산량(FLOPs), 추론 시간, 학습 시간, 파라미터 수 복잡도를 비교한 내용으로, 2개 층의 완전 연결(FC) 레이어로 구성된 비지도 학습(UL) 모델은 약 0.07 MFLOPs의 매우 낮은 연산량으로 0.01 ms 이내의 추론 시간을 달성하였다. 지도 학습(SL) 모델은 4개의 1D-CNN 층을 활용한 공간 특징 추출 과정으로 인해 약 1.2 MFLOPs의 연산량을 보였으나, 이 역시 실시간 시스템 운용에 충분한 수준이다. 강화 학습(RL)의 경우, 주어진 데이터 환경에 최적화된 하이퍼파라미터 조합을 스스로 탐색하는 NAS 과정에서 약 24시간 이상의 높은 학습 비용이 소요되었으나, 최종 도출된 모델은 추론 단계에서 매우 높은 연산 효율성을 유지하며 광대역 주파수 불변 특성을 성공적으로 확보하였다.

표 2. | Table 2. 각 모델별 연산량(FLOPs), 추론/학습 시간 및 파라미터 수 복잡도 비교 | Comparison of computational load (FLOPs), inference/training time, and parameter count complexity for each model.

Generating model	Computational load (MFLOPs)	Inference time (ms)	Training time (hours)
Supervised learning	1.2	≤0.05	3.5
Unsupervised learning	0.07	≤0.01	1.5
Reinforcement learning	0.9～1.1	≤0.05	≥24 (including NAS search)

Download Excel Table

그림 5～그림 7은 각각 지도 학습(SL), 비지도 학습(UL), 강화 학습(RL) 모델을 통해 생성된 빔 패턴을 보여준다.

그림 5. | Fig. 5. 지도 학습(공동 손실 CNN) 모델에 의해 생성된 빔 패턴 | Beam patterns generated by the SL (joint-loss CNN) model.

Download Original Figure

그림 6. | Fig. 6. 비지도 학습(오토인코더) 모델에 의해 생성된 빔 패턴 | Beam patterns generated by the UL (autoencoder) model.

Download Original Figure

그림 7. | Fig. 7. 강화 학습 agent에 의해 생성된 빔 패턴 | Beam patterns generated by the RL agent.

Download Original Figure

세 가지 접근법 모두 전체 운용 주파수 대역(f_min～f_max)에서 주파수 변화에 따라 빔폭이 좁아지는 빔 스퀀트 현상을 효과적으로 억제하고 있음을 시각적으로 확인할 수 있다. 특히, 목표 조향 각도인 −30° 방향에서 주파수와 무관하게 일정한 메인 빔폭을 형성하고 있으며, 이는 제안된 머신러닝 기반 프레임워크가 광대역 주파수 불변 빔포밍 가중치 벡터를 성공적으로 도출했음을 의미한다. 지도학습, 비지도학습, 강화학습에 따른 균일빔 생성시 목표 반전력 빔폭(HPBW) 20°에 대한 균일빔 생성 결과를 비교하기 위하여 그림 8과 같이 주파수별목표 균일빔 폭에 대한 RMSE 값을 제시하였다.

그림 8. | Fig. 8. 목표 반전력 빔폭(HPBW) 20°에 대한 RMSE 결과 | RMSE results for the target half-power beamwidth (HPBW) of 20°.

Download Original Figure

모의 수신 시나리오에서의 모델별 비트 오류율 성능을 그림 9～그림 11을 통하여 확인하였다. 이는 그림 4를 통하여 제시된 안테나 배열을 적용하여 모든 운용 주파수 대역(f_min～f_max) 및 방위각(−5°～55°)에 대하여 균일빔 또는 LCMV를 적용했을 경우 비트 오류율 성능을 반영한 결과이다.

그림 9. | Fig. 9. 지도 학습 모델 대 이론적인 주파수 의존적 LCMV의 BER 성능 | BER performance of the SL model vs. the frequency dependent LCMV.

Download Original Figure

그림 10. | Fig. 10. 비지도 학습 생성 모델 대 이론적인 주파수 의존적 LCMV의 BER 성능 | BER performance of the UL model vs. the frequency dependent LCMV.

Download Original Figure

그림 11. | Fig. 11. 강화 학습 agent 대 이론적인 주파수 의존적 LCMV의 BER 성능 | BER performance of the RL agent vs. the frequency dependent LCMV.

Download Original Figure

주파수 불변 빔포밍은 빔폭을 일정하게 유지하는 제약 조건으로 인해, 이론적으로 최대 SINR을 추구하는 일반적인 LCMV 빔포머 대비 수신 성능의 손실이 발생할 수 있다. 그러나 그림 9～그림 11에 나타난 비트 오류율 성능 곡선을 살펴보면, 제안된 세 가지 학습 모델 모두 이론적인 LCMV 성능 곡선(검은색)을 밀접하게 추종하는 것을 확인할 수 있다.

지도 학습(SL) 모델은 저대역(low), 중대역(mid), 고대역(high) 모두에서 LCMV와 유사한 BER 감소 추세를 보이며, 빔 형상 유지와 수신 성능 간의 균형을 잘 맞추고 있음을 그림 9를 통하여 보여준다. 그림 10의 비지도 학습(UL) 모델 또한 전 대역에서 LCMV 성능에 근접한 결과를 나타내며, 특히 높은 SNR 영역에서도 성능 저하가 최소화됨을 확인할 수 있다. 그림 11에서 강화 학습(RL) 에이전트에 의해 최적화된 모델 역시 전체 대역에서 안정적인 통신 성능을 보장하며, 이는 보상 함수 설계를 통해 빔 패턴의 균일성과 SINR 성능을 동시에 최적화한 결과로 해석된다.

종합적으로, 제안된 데이터 기반 접근법들은 광대역 환경에서 빔 패턴의 주파수 불변성을 확보함과 동시에, 통신 시스템이 요구하는 신뢰성 있는 수신 성능을 만족시키는 것으로 확인되었다.

정량적인 성능 평가는 표 3의 시뮬레이션 결과와 표 4의 야외 방사 테스트 결과를 통해 분석할 수 있다. 목표 반전력 빔폭(HPBW: half power beam width)인 20°에 대한 RMSE를 측정한 결과, 시뮬레이션 환경(표 3)에서는 비지도 학습(UL) 모델이 전체 대역 평균 RMSE 3.43°로 가장 우수한 주파수 불변성을 보였다. 이는 오토인코더가 입력 신호 환경의 잠재적 특징을 효과적으로 압축 및 학습하여 빔 형성의 안정성을 높인 것으로 분석된다. 실제 야외 방사 테스트(표 4)에서는 하드웨어의 불완전성과 채널 환경의 영향으로 인해 시뮬레이션 대비 오차가 다소 증가하였으나, 세 가지 모델 모두 전체 대역에서 약 5.5°~5.7° 수준의 균일한 RMSE 성능을 기록하였다. 이는 시뮬레이션 데이터로 사전 훈련된 모델을 보정된 실제 데이터로 미세 조정(fine-tuning)하는 과정이 실환경에서의 성능 열화를 방지하는 데 효과적이었음을 시사한다.

표 3. | Table 3. 모델링 및 시뮬레이션을 통한 주파수 균일 빔포밍 테스트 결과(단위: °) | Results of frequency-invariant beamforming test through modeling and simulation (unit: °).

Generating model	Low band	Mid band	High band	Total
Supervised learning	4.77	4.06	4.28	4.28
Unsupervised learning	4.17	3.75	3.17	3.43
Reinforcement learning	5.38	3.67	3.93	4.03

Download Excel Table

표 4. | Table 4. 야외 방사 테스트를 통한 주파수 균일 빔포밍 테스트 결과(단위: °) | Results of frequency-invariant beamforming test through radiation testing (unit: °).

Generating model	Low band	Mid band	High band	Total
Supervised learning	5.53	6.19	5.03	5.54
Unsupervised learning	5.36	6.41	4.87	5.57
Reinforcement learning	5.62	6.55	5.08	5.74

Download Excel Table

V. 결 론

본 논문에서는 광대역 안테나 시스템의 빔 스퀀트 현상을 해결하기 위해 지도, 비지도, 강화 학습 기반의 주파수 불변 빔포밍 설계 프레임워크를 제안하였다. 이 접근법은 시뮬레이션 데이터를 통한 사전 학습과 보정된 실제 데이터를 활용한 전이 학습을 결합하여, 하드웨어적 불완전성이 존재하는 실제 운용 환경에서도 강인하게 작동하도록 설계되었다.

성능 평가 결과, 제안된 세 가지 모델 모두 시뮬레이션 및 야외 방사 테스트 전반에서 목표 빔폭(20°)을 효과적으로 유지하며 약 5.5°~5.7°의 균일한 RMSE 성능을 달성하였다. 아울러 이론적인 LCMV 빔포머의 비트 오류율 곡선을 밀접하게 추종함으로써, 빔 형상의 균일성 유지와 통신 수신 성능 간의 트레이드오프를 성공적으로 최적화했음을 입증하였다.

Acknowledgements

본 연구는 정부(방위사업청)의 재원(No. 912831101)으로 수행된 연구임.

References

[1].

C. A. Balanis, Antenna Theory: Analysis and Design, Hoboken, NJ, John Wiley & Sons, 2016.

[2].

H. L. Van Trees, Optimum Array Processing: Part IV of Detection, Estimation, and Modulation Theory, New York, NY, John Wiley & Sons, 2002.

[3].

D. H. Johnson, D. E. Dudgeon, Array Signal Processing: Concepts and Techniques, Englewood Cliffs, NJ, Prentice Hall, 1993.

[4].

P. Pal, P. P. Vaidyanathan, “Nested arrays: A novel approach to array processing with enhanced degrees of freedom,” IEEE Transactions on Signal Processing, vol. 58, no. 8, pp. 4167-4181, Aug. 2010.

[5].

R. DuHamel, D. Isbell, “Broadband logarithmically periodic antenna structures,” in 1958 IRE International Convention Record, New York, NY, Mar. 1966, pp. 119-128.

[6].

B. D. Van Veen, K. M. Buckley, “Beamforming: A versatile approach to spatial filtering,” IEEE ASSP Magazine, vol. 5, no. 2, pp. 4-24, Apr. 1988.

[7].

C. L. Koh, S. Weiss, “Constant beamwidth generalised sidelobe canceller,” in IEEE/SP 13th Workshop on Statistical Signal Processing, Bordeaux, Jul. 2005, pp. 283-288.

[8].

W. Liu, S. Weiss, “Frequency invariant beamforming in subbands,” in Conference Record of the Thirty-Eighth Asilomar Conference on Signals, Systems and Computers, Pacific Grove, CA, Nov. 2004, pp. 1968-1972.

[9].

M. A. Elbir, K. V. Mishra, “Deep learning in antenna and array processing: A review,” IEEE Journal of Selected Topics in Signal Processing, vol. 16, no. 3, pp. 465-484, Apr. 2022.

[10].

T. O’Shea, J. Hoydis, “An introduction to deep learning for the physical layer,” IEEE Transactions on Cognitive Communications and Networking, vol. 3, no. 4, pp. 563-575, Dec. 2017.

[11].

C. F. Hayes, R. Rădulescu, E. Bargiacchi, J. Källström, M. Macfarlane, and M. Reymond, et al., “A practical guide to multi-objective reinforcement learning and planning,” Autonomous Agents and Multi-Agent Systems, vol. 36, no. 1, p. 26, Apr. 2022.

[12].

J. Tobin, R. Fong, A. Ray, J. Schneider, W. Zaremba, and P. Abbeel, “Domain randomization for transferring deep neural networks from simulation to the real world,” in 2017 IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS), Vancouver, BC, Sep. 2017, pp. 23-30.

[13].

S. J. Pan, Q. Yang, “A survey on transfer learning,” IEEE Transactions on Knowledge and Data Engineering, vol. 22, no. 10, pp. 1345-1359, Oct. 2010.

[14].

O. L. Frost, “An algorithm for linearly constrained adaptive array processing,” Proceedings of the IEEE, vol. 60, no. 8, pp. 926-935, Aug. 1972.

[15].

L. van der Maaten, G. Hinton, “Visualizing data using t-SNE,” Journal of Machine Learning Research, vol. 9, pp. 2579-2605, Nov. 2008.

[16].

Y. Sun, J. Zhang, A. Tibo, P. Aghabeyki, Z. Wei, and S. Luo, et al., “Data-driven Bayesian optimization framework for rapidly developing novel wideband, low-profile dipole antenna with 3-D-printed technology,” IEEE Transactions on Antennas and Propagation, vol. 73, no. 1, pp. 108-120, Jan. 2025.

Notes

장 재 원 [국방과학연구소/책임연구원]

jkiees-37-5-452-i1

https://orcid.org/0000-0001-8677-3263
2003년 2월: 서강대학교 전자공학과 (공학사)
2005년 2월: 서강대학교 전자공학과 (공학석사)
2011년 2월: 서강대학교 전자공학과 (공학박사)
2011년 1월～현재: 국방과학연구소 책임연구원
[주 관심분야] 전자전, 방향탐지, 신호처리 등

김 선 교 [국방과학연구소/선임연구원]

jkiees-37-5-452-i2

https://orcid.org/0000-0001-8714-2404
2010년 8월: 연세대학교 컴퓨터공학과 (공학사)
2013년 2월: 연세대학교 컴퓨터과학과 (공학석사)
2013년 12월～현재: 국방과학연구소 선임연구원
[주 관심분야] 전자기전 ES, SW

박 철 순 [국방과학연구소/수석연구원]

jkiees-37-5-452-i3

https://orcid.org/0000-0002-3678-4041
1989년 2월: 경기대학교 전자계산학과 (공학사)
1991년 2월: 인하대학교 전자계산공학과 (공학석사)
1997년 5월: 전자계산조직응용기술사
2007년 2월: 충남대학교 정보통신공학과 (공학박사)
1991년 2월～현재: 국방과학연구소 수석연구원
[주 관심분야] 통신 신호처리, 센서 어레이 신호처리 등