Ⅰ. 서 론
위상배열 레이다를 통한 전자주사 기술의 등장과 레이다 신호처리 기술의 발전에 따라 하나의 레이다 임무에 대한 처리 시간이 비약적으로 감소하게 되었고, 이는 추적, 감시, 표적 식별, 요격 확인 등의 여러 레이다 임무를 하나의 레이다에서 수행하는 다기능 레이다(Multifunction Radar: MFR)의 개발로 이어졌다. 이러한 다기능 레이다는 최근 항공기, 함정과 같은 다양한 형태의 플랫폼에 탑재되고 있으며, 플랫폼에서 레이다에 투입할 수 있는 한정적인 자원을 효율적으로 운용하기 위한 레이다 자원 관리(Radar Resource Management: RRM) 기법에 대한 필요성이 대두되고 있다[1]. 특히, 다수의 표적이 존재하는 경우 레이다 플랫폼의 한정된 자원으로 인하여 모든 표적에 대한 추적이 불가능하다. 이런 경우 자원관리 알고리즘을 이용하면 효과적으로 위협 표적에 대한 우선적인 추적을 수행할 수 있다[2].
이와 같은 표적 우선순위 할당을 위하여 속도, 거리 등 미리 정해진 단순한 기준에 따라 우선순위 할당을 수행하는 고정 우선순위 할당 기법에서부터 퍼지 논리 기반 기법[3], 은닉 마르코프 모델(Hidden Markov Model: HMM)을 이용하는 동적 계획법 기반 기법[4] 등 다양한 측면에서의 연구가 이루어져 왔다. 그러나 고정 우선순위 할당 기법의 경우 복잡한 전술 상황에 대처하는 능력이 떨어지고[5], 퍼지 논리 기반 기법은 각 변수에 대한 퍼지 멤버십 함수(fuzzy membership function)를 주관적으로 결정해 주어야 하는 어려움이 있다. 또한, 동적 계획법 기반 기법의 경우, 알고리즘의 계산량이 많아 실제 상황에서 실시간으로 입력을 처리하기에 적합하지 않다. 반면, 다양한 시나리오에 대한 학습이 완료된 인공 신경망을 이용하면 새로운 입력에 대해서도 실시간으로 우선순위 값을 산출할 수 있다[6]. 그러나 현재 레이다 자원관리의 관점에서 인공 신경망을 적용한 연구는 기본적인 인공 신경망 구조를 이용하여 개념을 제시한 수준에 그치며, 이 외에 다양한 구조를 적용하고 성능을 분석한 연구가 미비한 상태이다. 또한, 신경망 구조에 적용할 수 있는 여러 최적화 기법들이 존재하지만, 이에 대한 적용 가능성의 검토 및 성능 평가 관련 연구도 부족하다.
따라서, 본 논문에서는 신경망 구조에 기반한 자원관리 알고리즘의 연구를 수행하여 역전파(backpropagation) 기법 중 기존의 경사 하강법(gradeint descent) 이외에 새로이 최급 강하법(steepest descent)을 적용하여 신경망을 학습시키는 방법을 고안하였다. 이를 정확성 및 특정 시나리오에 대한 적합성 측면에서 분석하였으며, 결과적으로 추적 임무에서의 표적 우선순위 할당에 적합한 최급 강하법 기반의 인공 신경망 구조를 제안하였다.
Ⅱ. 본 론
본 절에서는 표적 우선순위 할당을 위해 구현한 단일 계층 인공 신경망의 구조와 출력 산출 및 학습 과정을 설명한다. 신경망의 전체적인 처리 과정을 정리하면 그림 1과 같다. 신경망의 입력 표적 정보(target information) xk는 다음과 같이 주어진다.
표적과 플랫폼 간 거리 (range)
표적의 속력 (speed)
표적의 진행 방향 (heading direction)
피아 (friend or foe)
표적이 존재하는 구역의 중요도 (regional importance)
위 변수들은 레이다부터 직접적으로 얻을 수 있는 정보이다. 피아의 경우 아군임을 식별할 수 있는 신호를 보내는 경우와 그렇지 않은 경우의 두 가지로 구분할 수 있다. 또한, 구역의 중요도는 MFR의 감시 임무와 연계되는 요소로 해당 표적이 발견된 감시 구역의 중요도에 따라 값이 결정된다.
하나의 은닉 계층(hidden layer)을 가지는 일반적인 단일 계층 인공 신경망 구조를 좀 더 자세히 나타내면 그림 2와 같이 나타낼 수 있다. 입력 계층(input layer)의 경우, 위에서 언급한 요소들을 다섯 개의 뉴런을 통해 입력으로 받으며(xi, i=1,2,…,5), 출력 계층(output layer)은 우선순위(priority) 값(y1)이 출력되는 하나의 뉴런을 갖는다. 은닉 계층에서는 뉴런의 개수를 임의로 정할 수 있으며, 은닉 뉴런의 수를 Q로 설정하였을 때 은닉 계층을 위한 입력을 ah(h=1,2,…,Q)로 나타낸다. 또한, 입력 계층과 은닉 계층은 계수 wih로, 은닉 계층과 출력 계층은 계수 wh1로 연결되어 있다. 이러한 계수는 신경망 생성 시 임의의 값으로 설정되며, 학습이 진행됨에 따라 새로운 값으로 갱신된다.
신경망에 신호가 입력되어 각 계층을 통과하고 최종 출력이 계산되기까지의 과정을 피드포워드(feedforward)라 한다. k번째 훈련 데이터 쌍 (xk,dk)에서 이며, dk는 우선순위 값을 나타낼 때, 신경망의 입력 계층과 출력 계층 사이에서 계산되는 뉴런 값은 다음과 같다.
위의 식에서 는 각각 k번째 데이터의 입력으로부터 계산된 은닉 계층과 출력 계층의 뉴런 값을 의미한다. 그리고 는 각각 입력 계층과 은닉 계층 사이의 계수와 은닉 계층과 출력 계층 사이의 계수를 의미한다. 는 은닉 계층의 출력 값을 의미하며, 뉴런 값을 0에서 1사이의 값으로 정규화하기 위해 에 대한 시그모이드(sigmoid) 함수의 형태로 식 (3)과 같이 정의된다.
또한, 알고리즘을 통해 최종적으로 얻는 값은 k번째 훈련 데이터 쌍에 대한 우선순위 예측 값 이며, 이 또한 결과를 우선순위 값의 범위로 나타내기 위해 시그모이드의 형태로 식 (4)와 같이 주어진다.
최종 출력 가 신경망을 통해 산출된 우선순위 값에 해당하고, 실제 우선순위 값 dk와의 오차 값은 식 (5) 및 식 (6)과 같다.
신경망 기반 자원관리 알고리즘의 학습은 위의 제곱 오차 ϵk의 값이 최소가 되도록 각 계층 사이의 계수들을 갱신하는 과정이다. 이 때, 계수의 그래디언트를 이용하는 역전파 알고리즘을 적용하며, 이를 식으로 나타내면 식 (7) 및 식 (8)과 같다.
식 (7), 식 (8)의 η는 훈련 계수(learning rate)를 의미한다. ϵk에 대한 계수의 그래디언트는 연쇄 법칙(chain rule)을 이용하여 계산할 수 있고, 그 결과는 다음과 같다[7].
식 (9), (11)의 결과를 식 (7), (8)에 대입하면 다음과 같이 다음 k+1번째 훈련 데이터 쌍을 위한 새로운 계수를 정리할 수 있다.
신경망의 계수가 모든 훈련 데이터를 반영할 수 있도록 위 과정을 각 데이터에 대하여 반복 수행한다.
일반적으로 역전파 과정에 이용되는 경사 하강법에서는 훈련 계수를 상수로 정의한다. 이 경우, 훈련 계수가 너무 작으면 신경망이 수렴하기까지 시간이 너무 오래 걸리고, 지나치게 크면 찾고자 하는 목적 함수의 최솟값을 뛰어넘는 경우가 생기므로 훈련 계수를 적절하게 설정해주는 것이 중요하다. 반면, 최급 강하법은 그림 3에서와 같이 그래디언트를 계산할 때마다 목적 함수를 가장 크게 감소시킬 수 있도록 최적화된 훈련 계수의 값을 계산한다. 이 과정은 다음과 같은 식으로 표현할 수 있다[8].
이렇게 구한 훈련 계수를 우선순위 할당을 위한 신경망에 적용함에 따라 더욱 정확하게 신경망을 학습시킬 수 있다.
Ⅲ. 시뮬레이션 결과
이 장에서는 제안한 인공 신경망 기반 표적 우선순위 할당 알고리즘을 검증하도록 한다. 이를 위해 다양한 시나리오를 고려하여 166개의 훈련 데이터를 생성하였다(표 1 참고). 레이다 플랫폼과 표적 사이의 거리는 최소 1 km에서 최대 100 km까지의 범위에서 거리가 가까워질수록 우선순위가 증가하도록 설정하고, 진행 방향은 표적이 플랫폼을 향해 수직으로 다가오는 경우를 180°로, 멀어지는 경우를 0°로 정의하여 0°에서 180°로 갈수록 우선순위가 증가하도록 설정하였다(그림 4 참고). 피아는 적이나 미확인 표적의 경우 1의 값을 할당하고 우선순위가 높아지도록 설정하였고, 아군 표적에는 0의 값을 할당하고 적 표적에 비해 낮은 우선순위를 가지도록 지정하였다. 구역의 중요도는 1(중요), 2(보통), 3(중요하지 않음)의 세 단계로 구분하여 표적이 존재하는 구역의 중요도가 높을수록 높은 우선순위가 할당되도록 하였다. 위에서 기술한 거리, 방향, 피아, 구역을 묶어 모든 시나리오에서 우선순위의 변화가 선형적으로 이루어지는 선형 파라미터로 정의하였다. 마지막으로 속력의 경우 표적이 다가올 때는 속력이 빠를수록 플랫폼에 빠르게 다가오므로 우선순위가 높고, 멀어질 때는 속력이 빠를수록 플랫폼에서 빠르게 멀어지므로 우선순위가 낮게 할당되도록 훈련 데이터를 설정하였다. 즉, 속력을 방향에 따라 우선순위에 다른 양상으로 반영되는 비선형 파라미터로 정의하였다(표 2 참고). 여기서 우선순위 값은 0에서 1사이의 값을 가져야 하므로, 훈련 데이터의 우선순위 값을 결정하기 위해 모든 파라미터들(거리, 속력, 방향, 피아, 구역)에 걸쳐 가장 중요하다고 판단되는 표적(표 1의 첫 번째 행)에 대하여 1의 우선순위 값을 부여한 후, 이를 기준으로 다른 훈련 데이터가 가지는 표적 파라미터들에 따라 훈련 데이터의 우선순위 값을 상대적으로 결정하였다.
이렇게 생성된 훈련 데이터를 이용하여 본론에서 소개한 단일 계층 인공 신경망을 학습시켰다. 신경망의 은닉 뉴런의 수는 60개로 설정하였고, 초기의 계수는 −0.5에서 0.5사이의 임의의 값으로 설정하였다. 경사 하강법과 최급 강하법의 두 가지 방법을 이용하였으며, 경사 하강법의 경우 훈련 계수를 0.25로 설정하였다. 학습 반복 횟수를 10,000회 까지 수행하였을 때 경사 하강법을 이용한 신경망과 최급 강하법을 이용한 신경망의 훈련 오차를 비교한 결과, 모든 훈련 반복 횟수에서 최급 강하법을 이용한 신경망의 훈련 오차가 더 낮게 나타나는 것을 확인할 수 있었다(그림 5). 훈련 오차는 각 학습 반복 횟수 마다 신경망이 모든 훈련 시나리오에 대해 산출한 우선순위 값과 실제 우선순위 값의 평균 제곱근 오차를 계산한 것이다. 따라서 표적 우선순위 할당 시에 고정된 훈련 계수를 설정하는 것보다 최급 강하법을 통한 훈련 계수를 적용하면 실제값에 더욱 근접한 우선순위 값을 도출할 수 있다.
다음으로, 신경망을 통한 우선순위 할당의 합리성을 알아보기 위하여 몇 가지 테스트 시나리오에 대한 시뮬레이션을 수행하였다. 마찬가지로 최급 강하법과 경사 하강법을 이용하여 신경망을 1,000회, 5,000회의 훈련 반복 횟수만큼 학습시켰다. 이러한 신경망에서 입력 변수의 변화가 우선순위 할당에 합리적으로 반영되는지를 알아보기 위하여 훈련 데이터에 포함되지 않는 시나리오로 선형 시나리오와 비선형 시나리오의 두 가지 테스트 시나리오를 생성하였다. 선형 시나리오의 경우 다른 조건이 동일한 상태에서 선형 파라미터에 해당하는 거리와 피아 조건을 다르게 하여 그에 따른 우선순위 할당 결과를 관찰하였다. 또한, 표적이 다가오는 방향일 때와 멀어지는 방향일 때 각각 속력을 다르게 하여 속력과 방향에 대한 비선형적 시나리오에서 우선순위 할당이 제대로 이루어지는지 알아보았다. 결과의 신뢰성을 위하여 각 신경망에 대해 학습을 독립적으로 30회 수행하고, 여기에 테스트 시나리오를 입력한 결과의 평균값을 최종 결과값으로 사용하였다.
먼저, 경사 하강법과 최급 강하법을 이용하여 신경망을 1,000회 학습시키고, 선형 시나리오를 적용하여 우선순위 할당 결과 값을 얻었다(표 3 참고). 표 3(a)와 표 3(b) 모두 시나리오 A에서 속력이 200 km/h, 방향이 180°, 적 표적, 중요도 보통의 구역일 때 거리가 70 km인 경우에 비해 50 km일 때 우선순위 값이 높게 나타나는 것을 확인할 수 있다. 또한 시나리오 B를 보면, 거리가 20 km, 속력이 100 km/h, 방향이 0°, 낮은 중요도의 구역으로 조건이 동일하고, 표적의 적대도만 적 표적과 아군 표적으로 다른 경우 표 3(a)와 표 3(b) 모두에서 적 표적의 우선순위가 월등히 높게 할당된 것을 볼 수 있다. 시나리오 C에서는 거리 45 km, 속력 200 km/h, 아군 표적, 낮은 중요도의 구역에서 방향이 180°인 표적과 0°인 표적을 비교한 것으로, 표 3(a), 표 3(b) 모두 레이다를 향해 다가오는 표적(180°)의 우선순위를 높게 할당하였다. 마지막으로, 시나리오 D에서는 거리 65 km, 속력 50 km/h, 방향 90°, 적 표적인 경우 구역의 중요도에 따른 할당 결과를 비교하였다. 그 결과, 표 3(a)와 표 3(b) 모두 구역의 중요도가 높을수록 표적의 우선순위를 높게 할당하는 것을 확인할 수 있었다.
일반적으로 인공 신경망에서 학습 횟수가 부족하면 훈련 데이터에 대한 신경망의 학습이 충분히 이루어지지 않아 원하는 결과를 얻지 못할 수 있다. 따라서 학습 횟수에 따라 우선순위 할당 결과가 달라질 수 있기 때문에 이에 대한 영향을 알아보기 위하여 학습 횟수를 증가시켜, 5,000회까지 학습시킨 신경망에 선형 시나리오를 적용한 결과가 표 4에 나타나 있다. 표 3에서와 같은 조건으로 시나리오 A~D에 따라 시뮬레이션을 진행한 결과, 1,000회 학습시킨 신경망에서와 같은 경향의 결과가 나타나는 것을 확인하였다. 지금까지의 결과를 통해 경사 하강법을 이용한 신경망과 최급 강하법을 이용한 신경망 모두 선형 시나리오에 대해서는 우선순위 할당이 합리적으로 이루어진다는 사실을 확인할 수 있었다.
다음으로, 비선형 시나리오(거리 35 km, 적 표적, 중요 구역)를 경사 하강법과 최급 강하법을 이용하여 1,000회학습한 신경망에 적용하였다(표 5). 경사 하강법을 이용한 신경망의 경우, 표 5(a)에서 시나리오 E를 보면 표적이 다가오는 방향(150°)일 때 속력이 300 km/h로 빠른 표적이 100 km/h인 표적에 비해 우선순위가 높아 훈련 데이터가 제대로 반영된 것을 확인할 수 있다. 그러나 시나리오 F에서 표적이 멀어지는 방향(30°)일 때 속력이 느린 표적의 우선순위가 더 높게 할당되지 않고, 오히려 속력이 빠른 표적의 우선순위가 높게 할당되는 반대의 결과를 보였다. 반면, 최급 강하법을 이용한 신경망에 비선형 시나리오를 적용한 경우 표 5(b)에서와 같이 표적이 다가올 때(시나리오 E) 속력이 빠른 표적의 우선순위가 낮고, 표적이 멀어질 때(시나리오 F) 속력이 느린 표적의 우선순위가 높은 결과를 보였다. 이는 훈련 데이터를 통해 의도한 바가 제대로 반영된 결과로 볼 수 있다. 따라서 경사 하강법을 이용한 신경망에서는 최적의 우선순위를 찾지 못하는 시나리오가 존재하고, 최급 강하법을 통해 이를 해결할 수 있다는 것을 확인하였다. 이러한 결과는 경사 하강법의 경우 지역 최저점(local minimum)에 빠지기 쉽고, 최급 강하법은 지역 최저점을 피해 보다 높은 확률로 전역 최저점(global minimum)을 찾을 수 있다는 특성에서 기인하는 것으로 분석된다.
5,000회 학습한 신경망에서도 마찬가지로 경사 하강법을 이용한 경우 표적이 다가올 때에는 속력의 차이가 우선순위 할당에 제대로 반영되었지만, 표적이 멀어질 때에는 낮은 속력의 표적에 대한 우선순위가 낮게 할당되어 비선형 파라미터에 따른 우선순위 할당이 올바르게 이루어지지 않았다(표 6(a) 참고). 반면, 최급 강하법을 이용하여 5,000회 학습한 신경망의 경우 표적이 다가올 때와 멀어질 때 모두 속력 차이에 따른 우선순위 할당이 바르게 이루어진 결과를 확인할 수 있었다(표 6(b)).
따라서 레이다 추적 임무에서 표적 우선순위 할당을 위해 인공 신경망 기법을 적용하는 경우 최급 강하법을 이용하여 신경망 알고리즘을 학습시키는 것이 더욱 적절할 것이다.
Ⅳ. 결 론
본 논문에서는 MFR의 입력으로부터 추적 임무의 표적 우선순위 할당을 위한 단일 계층 인공 신경망 알고리즘을 구현하였다. 또한 시뮬레이션을 통해 다양한 시나리오에 대한 분석을 수행하였고, 이를 바탕으로 기존의 경사 하강법 기반의 신경망 학습 알고리즘보다 제안한 최급 강하법 기반의 신경망 학습 알고리즘이 표적 우선순위 할당에 더 적합함을 보였다. 향후 연구에서는 다중 계층 인공 신경망 등 더 발전된 신경망 구조를 MFR에 적용할 방안을 고안하고, 레이다 자원 관리를 위한 최적의 신경망 기법에 대한 분석을 목표로 할 것이다.