MetaDE: 차분 진화로 차분 진화를 진화시키다

진화 연산의 핵심 알고리즘 중 하나인 차분 진화(Differential Evolution, DE)는 그 단순성과 높은 효율성 덕분에 블랙박스 최적화 문제에 널리 활용되어 왔습니다. 그러나 DE의 성능은 하이퍼파라미터와 전략의 선택에 크게 의존하며, 이는 연구자들에게 지속적인 과제였습니다. 이 문제를 해결하기 위해 EvoX 팀은 최근 *IEEE Transactions on Evolutionary Computation (IEEE TEVC)*에 “MetaDE: Evolving Differential Evolution by Differential Evolution”이라는 제목의 연구를 발표했습니다. DE를 활용하여 자체 하이퍼파라미터와 전략을 진화시키는 메타 진화 방법인 MetaDE는 GPU 가속 병렬 컴퓨팅을 통합하면서 파라미터와 전략의 동적 조정을 가능하게 합니다. 이 설계는 최적화 성능과 함께 계산 효율성을 크게 향상시킵니다. 실험 결과, MetaDE는 CEC2022 벤치마크 스위트와 로봇 제어 작업 모두에서 뛰어난 성능을 보여줍니다. MetaDE의 소스 코드는 GitHub에서 오픈소스로 공개되어 있습니다: https://github.com/EMI-Group/metade.

배경

진화 연산 분야에서 알고리즘의 성능은 하이퍼파라미터의 선택에 의해 크게 영향을 받는 경우가 많습니다. 특정 문제에 가장 적합한 파라미터 설정을 결정하는 것은 오랜 연구 과제였습니다. 고전적인 진화 알고리즘인 차분 진화(DE)는 그 단순성과 견고한 전역 탐색 능력으로 널리 선호되지만, 그 성능은 하이퍼파라미터 선택에 매우 민감합니다. 기존 방법들은 일반적으로 경험 기반 튜닝이나 적응형 메커니즘에 의존하여 성능을 개선합니다. 그러나 다양한 문제 시나리오에 직면했을 때, 이러한 접근 방식은 효율성과 광범위한 적용 가능성 사이의 균형을 맞추는 데 어려움을 겪는 경우가 많습니다.

“메타 진화(Meta-Evolution)“의 개념은 이미 지난 세기에 도입되었으며, 진화 알고리즘 자체를 사용하여 해당 알고리즘의 하이퍼파라미터 구성을 최적화하는 것을 목표로 합니다. 메타 진화는 오랜 역사를 가지고 있지만, 높은 계산 요구량으로 인해 실용적 적용이 제한되어 왔습니다. 최근 GPU 컴퓨팅의 발전은 이러한 제약을 완화하여 진화 알고리즘에 강력한 하드웨어 지원을 제공하고 있습니다. 특히 분산 GPU 가속 EvoX 프레임워크의 도입은 GPU 기반 진화 알고리즘의 개발을 크게 촉진했습니다. 이러한 배경에서 우리 연구팀은 DE를 활용하여 자체 하이퍼파라미터와 전략을 진화시키는 새로운 메타 진화 접근 방식을 제안하여, 진화 알고리즘의 오랜 파라미터 튜닝 문제를 해결하기 위한 새로운 방법을 제시합니다.

메타 진화란 무엇인가?

메타 진화의 핵심 아이디어는 “진화 알고리즘을 사용하여 자기 자신을 진화시키는 것”(Evolving an Evolutionary Algorithm by an Evolutionary Algorithm)으로 요약할 수 있습니다. 이 개념은 진화 알고리즘을 사용하여 문제의 최적 해를 탐색할 뿐만 아니라, 알고리즘 자체의 진화 과정을 통해 하이퍼파라미터와 전략을 적응시킨다는 점에서 기존의 진화 연산 방법을 초월합니다.

다시 말해, 메타 진화는 “자기 진화(self-evolution)” 패러다임을 도입하여, 알고리즘이 문제 해의 탐색 공간을 탐구하면서 동시에 자기 자신을 최적화할 수 있게 합니다. 진화 과정에서 지속적으로 자신을 개선함으로써, 알고리즘은 더 적응적이 되고 다양한 문제 시나리오에서 높은 효율성을 유지할 수 있습니다.

MetaDE를 예로 들면, 그 설계는 이 철학에 뿌리를 두고 있습니다. 이중 계층 구조에서 하위 계층(“실행자(executor)“)은 파라미터화된 DE를 사용하여 주어진 최적화 문제를 풀고, 상위 계층(“진화자(evolver)“)은 동시에 DE를 사용하여 실행자의 하이퍼파라미터 구성을 최적화합니다. 이 프레임워크를 통해 DE는 단순히 문제 해결자로서의 역할뿐만 아니라, 다양한 문제를 더 효과적으로 해결하기 위해 자체 파라미터와 전략을 어떻게 조정할지 “탐색”할 수 있습니다. 이러한 과정은 시스템이 점진적으로 자신을 이해하고 개선하는 것과 유사하며, **“수동적으로 문제를 해결하는 것”에서 “능동적으로 자기 진화하는 것”**으로의 전환입니다. 결과적으로 다양한 작업에 더 잘 적응할 수 있습니다. DE를 복잡한 시스템으로 간주한다면, MetaDE는 이 시스템 내에서 “재귀적” 방식의 자기 이해와 자기 개선을 효과적으로 가능하게 합니다.

컴퓨터 과학에서 “재귀(recursion)“라는 용어는 일반적으로 자기 자신을 호출하는 함수나 절차를 설명합니다. MetaDE 내에서 이 개념은 새로운 의미를 갖습니다: DE의 하이퍼파라미터를 진화시키기 위해 DE를 사용하는 내부적으로 재귀적인 최적화 메커니즘입니다. 이 자기 참조적 방식은 강력한 적응성을 구현할 뿐만 아니라, “공짜 점심은 없다(no free lunch)” 정리에 대한 새로운 관점을 제공합니다. 모든 문제에 대해 보편적으로 최적인 단일 파라미터 세트는 존재하지 않으므로, 알고리즘이 자율적으로 자기 자신을 진화시키도록 하는 것이 주어진 작업에 대한 최적의 파라미터 구성을 찾는 핵심입니다.

이 재귀적 메타 진화 접근 방식을 통해 MetaDE는 여러 가지 이점을 달성합니다:

1. 자동화된 파라미터 튜닝

 노동 집약적인 수동 튜닝 과정이 제거됩니다. 알고리즘 자체가 하이퍼파라미터를 조정하는 방법을 학습하여, 인간의 개입을 줄이고 효율성을 향상시킵니다.

2. 향상된 적응성

 MetaDE는 변화하는 문제 특성과 조건에 동적으로 대응하며, 실시간으로 전략을 수정하여 성능을 개선합니다. 이는 알고리즘의 유연성을 크게 증가시킵니다.

3. 효율적인 탐색 내재된 병렬성을 활용하여, MetaDE는 대규모 최적화 문제에서의 탐색을 크게 가속화합니다. 합리적인 시간 내에 고차원의 복잡한 문제에 대한 실행 가능한 해를 제공합니다.

알고리즘 구현

MetaDE는 텐서 기반 기법과 GPU 가속을 활용하여 효율적인 병렬 컴퓨팅을 가능하게 합니다. 집단의 많은 개체를 동시에 처리함으로써 전체적인 계산 효율성이 현저히 향상되며, 이는 단일 목적 블랙박스 최적화 및 대규모 최적화 문제에서 특히 유리합니다. 핵심 파라미터와 데이터 구조(예: 집단, 적합도, 전략 파라미터)의 텐서화를 통해 MetaDE는 더 높은 계산 효율성을 달성할 뿐만 아니라 복잡한 최적화 문제를 해결하는 능력도 향상시킵니다. 고전적인 DE 및 기타 진화 알고리즘(EAs)과 비교하여, MetaDE는 대규모 문제 해결에서 우수한 성능을 보여줍니다. 텐서 기반 접근 방식 덕분에 MetaDE는 계산 자원을 더 효과적으로 활용하여, 기존 방법보다 더 빠른 해와 더 정밀한 최적화 결과를 산출합니다.

PDE 아키텍처

연구팀은 먼저 파라미터와 전략의 수정을 완전히 지원하는 파라미터화된 DE 알고리즘 프레임워크(PDE)를 제안했습니다. 이 프레임워크에서 F와 CR은 연속 파라미터이고, 나머지 파라미터는 이산적입니다. 점선 상자는 허용 가능한 파라미터 값의 범위를 나타냅니다. 돌연변이 함수는 좌측 및 우측 기저 벡터와 차분 벡터의 수를 제어하는 파라미터로부터 도출됩니다.

MetaDE 아키텍처

MetaDE는 진화자(evolver)(상위 계층)와 다수의 실행자(executors)(하위 계층)로 구성된 이중 계층 구조를 채택합니다. 진화자는 DE(또는 잠재적으로 다른 진화 알고리즘)로, PDE의 파라미터를 최적화하는 역할을 합니다. 진화자 집단의 각 개체 x_i는 고유한 파라미터 구성 θ_i에 대응합니다. 이러한 구성은 PDE에 전달되어 서로 다른 DE 변형을 인스턴스화하며, 각각은 주어진 최적화 작업에서 독립적으로 실행되는 실행자에 의해 관리됩니다. 각 실행자는 최적 적합도 값 y^*를 진화자에게 반환하고, 진화자는 해당 적합도 값 y_i를 대응하는 개체 x_i에 할당합니다.

실험 성능

MetaDE의 효과를 종합적으로 평가하기 위해, 연구팀은 다수의 벤치마크 테스트와 실제 시나리오에 걸쳐 체계적인 실험을 수행했습니다. 각 실험에서는 진화자(rand/1/bin 전략의 DE)와 실행자(집단 크기 100의 PDE)를 사용했습니다. 주요 실험 구성 요소는 다음과 같습니다:

CEC2022 벤치마크 단일 목적 최적화 작업에서 MetaDE를 다양한 DE 변형과 비교합니다.

상위 4개 CEC2022 알고리즘과의 비교 동일한 함수 평가 횟수(FEs) 예산 하에서 CEC2022 대회의 상위 4개 알고리즘과 MetaDE를 평가합니다.

고정 실행 시간 내 함수 평가 횟수(FEs) GPU 가속 하에서 MetaDE의 계산 효율성을 분석합니다.

로봇 제어 작업 Brax 플랫폼 환경에서 로봇 제어 작업에 MetaDE를 적용하여 실용성을 검증합니다.

CEC2022 벤치마크: 주류 DE 변형과의 비교

연구팀은 CEC2022 벤치마크 스위트에서 MetaDE를 여러 대표적인 DE 변형과 비교했으며, 비교 대상은 다음과 같습니다:

Standard DE (rand/1/bin)
SaDE 및 JaDE (적응형 DE 알고리즘)
CoDE (전략 통합 DE)
SHADE 및 LSHADE-RSP (성공 이력 기반 적응형 DE)
EDEV (통합 DE 변형)

모든 알고리즘은 EvoX 플랫폼에서 구현되었으며, 공정성을 위해 집단 크기 100으로 GPU 가속을 활용했습니다. 실험은 동일한 계산 시간 제약(60초) 하에서 서로 다른 차원(10D 및 20D)에서 수행되었습니다.

10D CEC2022 최적화 결과

20D CEC2022 최적화 결과

MetaDE는 대부분의 테스트 함수에서 일반적으로 더 빠르고 안정적인 수렴을 달성합니다. 파라미터화된 DE(PDE)와 상위 계층 최적화의 결합을 통해 서로 다른 문제 공간에 동적으로 적응할 수 있으며, 전반적인 견고성과 탐색 성능을 향상시킵니다.

상위 4개 CEC2022 알고리즘과의 비교 (동일 FEs 조건)

MetaDE의 최적화 능력을 더욱 평가하기 위해, 동일한 함수 평가 예산 내에서 CEC2022 대회의 상위 4개 알고리즘과 비교했습니다:

EA4eig: 다수의 EAs를 통합한 하이브리드 방법
NL-SHADE-LBC: 개선된 적응형 DE
NL-SHADE-RSP-MID: 중간점 추정이 강화된 SHADE
S-LSHADE-DP: 동적 섭동을 통해 집단 다양성을 유지하는 DE 변형

이 알고리즘들은 각각 공식 파라미터 설정과 소스 코드를 사용하여 동일한 FE 제약 하에서 실행되었습니다. CEC2022 테스트 스위트에서 MetaDE와 각 기준 알고리즘 간의 통계적 비교(Wilcoxon 순위합 검정, 유의 수준 0.05)가

수행되었습니다. 표의 마지막 행은 서로 다른 테스트 함수에서 각 알고리즘의 MetaDE 대비 성능을 보여줍니다: + (유의하게 우수), ≈ (유의한 차이 없음), − (유의하게 열등).

10D CEC2022 대회 알고리즘 비교 (동일 FEs)

20D CEC2022 대회 알고리즘 비교 (동일 FEs)

MetaDE는 특히 견고한 수렴이 필요한 복잡한 문제에서 일관되게 강력한 성능을 보여줍니다. 자기 적응 메커니즘 덕분에 MetaDE는 서로 다른 탐색 환경에 맞게 전략을 효과적으로 조정하여, 탐색 효율성과 전역 최적화 능력을 향상시킵니다. 이러한 결과는 MetaDE가 주류 DE 변형을 능가할 뿐만 아니라 최상위 대회 알고리즘에 대해서도 강한 경쟁력을 보여준다는 것을 나타냅니다.

계산 효율성: 고정 시간(60초) 내 FEs

연구팀은 **동일한 고정 실행 시간(60초) 내에서 서로 다른 알고리즘이 완료한 함수 평가 횟수(FEs)**를 추가로 기록했습니다.

图片2.png

       각 알고리즘이 60초 내에 달성한 FEs

동일한 EvoX 프레임워크에서 GPU 가속 병렬 연산을 사용한 결과, MetaDE는 평균적으로 10****⁹ 수준의 FEs를 달성한 반면, 기존 DE 변형은 약 10^6 FEs에 그쳤습니다. 이 이점은 MetaDE의 파라미터화된 접근 방식에서 비롯되며, 개체의 대규모 병렬 평가를 수행하여 더 효율적인 하드웨어 자원 활용을 가능하게 합니다. 결과적으로 알고리즘은 동일한 시간 내에 더 많은 해를 탐색하여, 해의 품질과 안정성을 모두 향상시킵니다.

진화적 강화학습: 로봇 제어 작업

강화학습(RL)에서 정책 최적화의 효율성과 안정성은 매우 중요합니다. PPO 및 SAC와 같은 그래디언트 기반 방법은 고차원 환경에서 그래디언트 소실 또는 폭발 문제를 겪을 수 있습니다. 반면, 진화적 강화학습(EvoRL)은 그래디언트 프리 탐색을 사용하여 정책 파라미터를 직접 최적화함으로써 이러한 문제를 우회합니다.

진화적 강화학습 프로세스

EvoRL 프레임워크 내에서 MetaDE는:

신경망 파라미터를 자동으로 최적화하여 정책 모델의 적응성을 높입니다.
하이퍼파라미터를 동적으로 조정하여 학습 안정성을 향상시킵니다.
GPU 가속을 활용하여 정책 최적화를 가속화합니다.

복잡한 최적화 작업에서 MetaDE의 성능을 평가하기 위해, Brax 시뮬레이션 플랫폼에서 GPU 가속 최적화를 사용하여 로봇 제어 문제에 적용했습니다. 연구에는 Swimmer, Hopper, Reacher의 세 가지 작업이 포함되었으며, 각각 3층 완전 연결 신경망(MLP)으로 모델링되어 보상 최대화를 목표로 합니다. 특히 각 MLP는 약 1,500개의 파라미터를 포함하여, 진화 알고리즘(EAs)에 대한 1,500차원 최적화 과제를 생성합니다. 이는 탐색 능력과 계산 효율성 모두에 엄격한 요구 사항을 부과합니다.

세 가지 Brax 환경의 수렴 곡선

그림에서 보듯이, MetaDE는 Brax 기반 로봇 제어 작업에서 강력한 성능을 보여주며, Swimmer 작업에서 최고의 결과를, Hopper와 Reacher에서 거의 최적에 가까운 결과를 달성합니다. 주요 이점은 초기 집단의 높은 품질에 있으며, 이를 통해 초기 단계에서 빠른 수렴이 가능하고 고품질의 해를 생성합니다. 이러한 결과는 MetaDE가 신경망 정책을 효율적으로 최적화할 수 있으며, 복잡한 물리 시뮬레이션이 포함된 로봇 제어 작업에 적합하고 실용적 응용에 대한 광범위한 잠재력을 제공한다는 것을 시사합니다.

결론 및 향후 방향

MetaDE는 최적화 작업을 해결하는 데 뛰어날 뿐만 아니라 자체 전략을 자율적으로 튜닝하고 개선하는 혁신적인 메타 진화 접근 방식입니다. 차분 진화의 강점을 활용하여, MetaDE는 적응형 파라미터 구성과 전략 진화에서 강력한 잠재력을 보여줍니다. 실험 결과는 다양한 벤치마크 테스트에서 우수한 견고성을 보여주며, 진화적 강화학습을 통한 로봇 제어 작업에서의 성공은 실제 적용 가능성을 뒷받침합니다. 핵심 과제는 일반화와 특수화 사이의 최적 균형을 유지하는 것으로, 알고리즘이 다양한 작업에 적응하면서도 특정 문제에 대해 효과적으로 최적화할 수 있도록 보장하는 것입니다. 이 연구는 자기 적응형 진화 알고리즘에 대한 새로운 관점을 제공하며, 복잡한 시스템을 위한 메타 진화의 추가적인 발전을 촉진할 수 있습니다.

오픈소스 코드 및 커뮤니티

논문: https://arxiv.org/abs/2502.10470

GitHub: https://github.com/EMI-Group/metade

상위 프로젝트 (EvoX): https://github.com/EMI-Group/evox

QQ 그룹: 297969717

QQ 그룹 | Evolving Machine Intelligence

MetaDE는 EvoX 프레임워크를 기반으로 구축되었습니다. EvoX에 관심이 있으시다면, 자세한 내용은 EvoX 1.0에 관한 기사를 확인해 주십시오.

(https://mp.weixin.qq.com/s/uT6qSqiWiqevPRRTAVIusQ)