4. 고급 기능

EvoX는 더 복잡한 요구 사항을 충족하기 위해 다양한 고급 기능을 제공합니다. 기본 사항에 익숙해진 후, 이 장에서는 프레임워크 구성을 사용자 정의하고, 선택적 플러그인 모듈을 관리하며, 성능을 최적화하는 방법을 소개하여 필요할 때 EvoX를 확장하고 조정할 수 있도록 돕습니다.

사용자 정의 구성 (Custom Configuration)

EvoX의 기본 설정은 대부분의 상황에 적합하지만, 때로는 프레임워크의 동작이나 매개변수를 사용자 정의하고 싶을 수 있습니다. 예를 들면 다음과 같습니다:

알고리즘 매개변수 조정: 기본 개체군 크기와 반복 횟수 외에도 많은 알고리즘이 고급 매개변수를 노출합니다. 예를 들어, CMA-ES는 초기 공분산 행렬 구성을 허용하며, NSGA-II는 혼잡 거리(crowding distance) 매개변수를 노출합니다. 알고리즘의 생성자에 매개변수를 전달할 수 있습니다. 예: GA(crossover_prob=0.9, mutation_prob=0.1)은 유전 알고리즘(Genetic Algorithm)에서 교차 및 돌연변이 확률을 사용자 정의합니다. 이를 조정하면 성능을 미세 조정할 수 있습니다. 사용 가능한 매개변수와 기본값이 나열된 각 알고리즘의 API 문서를 참조하세요.
연산자 구성 요소 교체: 내부 진화 연산자(예: 선택 또는 돌연변이 전략)를 교체할 수 있습니다. 일부 알고리즘 클래스는 사용자 정의 연산자 객체 전달을 지원합니다. 예를 들어, 차분 진화(Differential Evolution, DE)는 사용자 정의 돌연변이 연산자를 지원하여 사용자 정의 함수나 Operator 클래스를 제공할 수 있게 합니다. EvoX의 모듈식 설계는 이러한 “플러그인 스타일” 교체를 지원합니다. 이는 일반적으로 알고리즘 내부에 대한 이해가 필요하며 표준 사용 사례에서는 보통 필요하지 않습니다.
다목적 설정: 다목적 최적화의 경우 선호도나 가중치를 구성해야 할 수 있습니다. 예를 들어 가중치 합계 방법을 위한 가중치 벡터 설정이나 진화 중 참조점(reference points) 조정 등이 있습니다. 이러한 구성은 일반적으로 문제(Problem) 또는 알고리즘 클래스의 매개변수를 통해 노출됩니다. 예를 들어, problem = DTLZ2(d=12, m=3)은 12차원, 3개 목적 함수 문제를 정의합니다. 일부 알고리즘은 사용자 정의 참조 벡터 전달을 허용합니다. 알고리즘 문서를 읽으면 이러한 설정을 완전히 활용하는 데 도움이 됩니다.
로깅 및 출력: 기본 EvalMonitor는 이미 주요 최적화 지표를 기록합니다. 추가 정보(예: 개체군 다양성 또는 세대별 평균 적합도)가 필요한 경우 모니터를 사용자 정의하거나 루프 내에서 수동으로 로그를 남길 수 있습니다. 장기 실행 작업의 경우 파일에 로그를 남기고 싶을 수 있습니다. 이는 Python의 logging 라이브러리나 간단한 파일 I/O를 사용하여 나중에 분석할 수 있도록 결과를 추가(append)하는 방식으로 수행할 수 있습니다.

요약하자면, 사용자 정의 구성은 특정 작업에 맞게 EvoX의 기본 동작을 수정하는 것을 의미합니다. 이는 일반적으로 EvoX API를 더 깊이 사용하는 것을 포함합니다. 이에 대해서는 개발 및 확장 섹션에서 더 다룰 것입니다. 초보자는 이것만 기억하세요: EvoX는 숙련된 사용자가 거의 모든 세부 사항을 조정할 수 있는 유연한 인터페이스를 제공하지만, 기본값을 그대로 사용하여 빠르게 결과를 얻을 수도 있습니다.

플러그인 관리

여기서 “플러그인”은 시각화 도구, 강화 학습 환경 래퍼, EvoX 생태계의 자매 프로젝트와 같은 EvoX의 선택적 구성 요소나 확장 모듈을 의미합니다. EvoX에서 플러그인을 관리하는 것은 주로 선택적 모듈을 설치하고 사용하는 것을 말합니다. 주요 확장 기능과 관리 방법은 다음과 같습니다:

시각화 플러그인: EvoX에는 차트 작성을 위한 plot 서브모듈이 포함된 evox.vis_tools 모듈이 있으며, 실시간 데이터 스트림을 위한 .exv 로그 형식을 지원합니다. 시각화를 사용하려면 vis 추가 옵션으로 EvoX를 설치하세요: pip install evox[vis]. (처음에 설치하지 않았다면 나중에 설치하거나 pip install plotly를 실행하여 의존성을 충족시킬 수 있습니다.) 시각화 도구를 사용할 때는 일반적으로 모니터가 데이터를 기록한 후 플롯 함수를 호출합니다. 예: EvalMonitor.plot()은 vis_tools.plot을 사용합니다. 이 플러그인이 설치되어 있는지 확인하면 matplotlib 같은 라이브러리 누락으로 인한 오류를 방지할 수 있습니다.
신경진화(Neuroevolution) 플러그인: EvoX는 강화 학습 환경(Brax 물리 엔진 등)과 신경 개체 최적화(신경진화)를 지원합니다. 이러한 기능은 neuroevolution 확장에 번들로 제공되며 pip install "evox[neuroevolution]"으로 설치됩니다. 여기에는 Google Brax 라이브러리, Gym 등이 포함됩니다. 설치 후 evox.problems.neuroevolution의 BraxProblem과 같은 래퍼를 사용하여 RL 환경을 최적화 문제로 전환할 수 있습니다. PyTorch 모델 파라미터를 진화를 위해 벡터로 평탄화(flatten)하는 ParamsAndVector와 같은 도구도 포함되어 있습니다. Brax는 Linux 또는 WSL을 통한 Windows에서만 작동하며, 네이티브 Windows Python에서는 CPU에서만 실행될 수 있음에 유의하세요. 간단히 말해, EvoX 플러그인의 활성화 또는 비활성화는 특정 추가 기능(extras)의 설치를 통해 제어됩니다.
자매 프로젝트: EvoX에는 EvoRL(진화적 강화 학습 중심) 및 EvoGP(GPU 가속 유전 프로그래밍)와 같은 관련 프로젝트가 있습니다. 이들은 EvoX의 설계 철학 인터페이스를 공유합니다. 작업이 RL 중심이라면 이러한 전용 프레임워크를 선호할 수 있습니다. 이러한 플러그인을 관리한다는 것은 버전 호환성을 확인하고 의존성을 충족시키는 것을 의미합니다. 예를 들어, EvoRL은 JAX와 Brax를 사용하는 반면, EvoGP는 기호 트리(symbolic tree) 라이브러리가 필요할 수 있습니다. 이러한 라이브러리들은 보통 충돌 없이 공존할 수 있습니다. 이들을 메인 EvoX 프로젝트에서 호출할 수 있는 보완 도구로 생각하거나, 가벼운 설정을 위해 제외할 수도 있습니다.
사용자 정의 플러그인: EvoX의 모듈성 덕분에 자신만의 “플러그인”을 구축할 수 있습니다. 예를 들어, 고유한 지표를 추적하는 사용자 정의 Monitor 클래스나 타사 시뮬레이터를 래핑하는 사용자 정의 Problem 서브클래스를 만들 수 있습니다. 이는 효과적으로 EvoX의 기능을 확장합니다. 모범 사례는 EvoX의 인터페이스 계약을 따르는 것입니다. 예를 들어, 사용자 정의 Problem에 evaluate() 메서드가 있는지, 사용자 정의 Monitor가 기본 클래스를 상속하는지 확인하세요. 테스트가 완료되면 EvoX의 향후 릴리스에 기여할 수도 있습니다.

전반적으로 EvoX의 플러그인 관리는 유연한 확장과 의존성 제어에 관한 것입니다. 초보자는 설치 중에 vis 및 neuroevolution 확장을 포함할지 결정할 수 있습니다. 처음에 설치하지 않았더라도 나중에 추가할 수 있습니다. 플러그인을 사용하면 최적화 진행 상황을 더 쉽게 모니터링하고 EvoX를 외부 도구와 통합하여 더 강력한 기능을 활용할 수 있습니다.

성능 최적화

성능은 EvoX의 주요 강점입니다. 동일한 알고리즘을 사용하더라도 EvoX의 GPU 지원은 속도를 몇 자릿수(orders of magnitude) 높일 수 있습니다. 그러나 이를 완전히 활용하려면 몇 가지 팁을 따르는 것이 좋습니다:

GPU 병렬 처리 사용: 먼저 코드가 실제로 GPU에서 실행되고 있는지 확인하세요. 앞서 언급했듯이 CUDA가 활성화된 PyTorch를 설치하고 데이터를 GPU 장치로 이동하세요. 속도가 느리다면 torch.cuda.is_available()을 확인하세요. True를 반환해야 합니다. GPU가 존재하지만 사용되지 않는다면 텐서가 기본적으로 CPU에서 생성되었기 때문일 가능성이 큽니다. device를 명시적으로 설정하거나 입력 텐서(예: lb/ub)가 CUDA에 있는지 확인하여 이를 수정하세요. EvoX는 이러한 입력의 장치 설정을 따릅니다. 다중 GPU 시스템에서 EvoX는 일반적으로 프로세스당 하나의 GPU를 사용합니다. 여러 GPU를 활용하려면 서로 다른 GPU로 여러 프로세스를 실행하거나 조정된 다중 GPU 실행에 대한 향후 지원을 기다려야 합니다.
병렬 평가: 진화 알고리즘의 주요 병목 현상은 **적합도 평가(fitness evaluation)**입니다. 평가는 종종 독립적이므로 병렬화할 수 있습니다. EvoX는 가능한 경우 평가를 배치(batch) 처리합니다. 예를 들어 신경망 평가나 다항식 함수는 GPU를 사용하여 병렬로 계산할 수 있습니다. 사용자 정의 문제의 경우 Python 루프를 피하고 평가 코드를 벡터화하여 후보 배치를 한 번에 처리하세요. 이는 PyTorch의 병렬 기능을 최대한 활용하게 합니다. 간단히 말해, 문제의 evaluate() 함수가 개별 솔루션이 아닌 배치 단위로 작동하게 하면 엄청난 속도 향상을 얻을 수 있습니다.
최적화를 위한 컴파일: PyTorch 2.0은 성능 향상을 위해 모델/함수를 JIT 컴파일하는 torch.compile을 도입했습니다. 평가 로직이 복잡한 경우 실행 전에 컴파일을 고려하세요:
```
jit_state_step = torch.compile(workflow.step())
```
이는 성능을 크게 향상시킬 수 있습니다.

참고:

컴파일은 오버헤드를 추가하며 모든 함수나 문제에서 지원되는 것은 아닙니다. 대규모 장기 실행 작업에 가장 적합합니다. Windows에서는 torch.compile이 작동하려면 Triton이 설치되어 있어야 합니다.

개체군 크기 조정: 개체군이 클수록 다양성과 전역 탐색 능력이 증가하지만 세대당 계산량도 증가합니다. pop_size를 조정하여 품질과 속도의 균형을 맞추세요. GPU에서는 병렬 처리 덕분에 선형적인 시간 비용 없이 크기를 늘릴 수 있는 경우가 많습니다. 하지만 크기가 너무 크면 메모리 문제가 발생할 수 있습니다. GPU 메모리가 부족한 경우 개체군 크기나 문제 차원을 줄이거나, 공간을 절약하기 위해 FP16을 사용하세요 (torch.set_float32_matmul_precision('medium') 설정).
Python 오버헤드 감소: EvoX는 대부분의 핵심 연산을 torch.Tensor로 옮기지만, 사용자가 작성한 루프나 사용자 정의 연산자는 과도한 Python 수준 작업을 피해야 합니다. 잦은 출력(높은 I/O 비용), 리스트 사용, 데이터 유형 변환을 피하세요. 코드를 벡터화/텐서화하여 내부적으로 빠른 C++/CUDA 커널을 활용하고 Python 인터프리터 오버헤드를 줄이세요.
분산 배포: 초대형 문제의 경우 여러 머신에서 실행하는 것을 고려하세요. EvoX는 다중 노드 설정(백엔드 통신 및 샤딩을 통해)을 지원합니다. 초보자에게 친숙하지는 않지만 이런 기능이 있다는 것을 아는 것이 좋습니다. GPU 클러스터가 있는 경우 EvoX의 분산 배포 문서를 참조하세요. 일반적으로 환경 변수를 설정하거나 특수 스크립트로 실행해야 합니다. 아키텍처는 동일한 코드가 단일 또는 다중 노드 설정에서 실행될 수 있도록 허용합니다. 처음 시도할 때는 한 머신에서 여러 프로세스로 시뮬레이션해 보세요.
성능 프로파일링: 더 깊이 파고들려면 PyTorch 프로파일러나 Python의 cProfile 같은 도구를 사용해 병목 현상을 분석하세요. 이를 통해 시간이 평가, 선택 또는 다른 곳에서 소요되는지 파악하여 그에 따라 최적화(예: 반복 계산 캐싱)할 수 있습니다. EvoX는 성능을 위해 구축되었지만 실제 작업에서는 분석이 필요한 고유한 병목 현상이 발생할 수 있습니다.

요약하자면, EvoX는 아키텍처 수준에서 이미 최적화되어 있지만, 사용자는 GPU의 올바른 사용, 배치 컴퓨팅, 매개변수 조정을 통해 성능을 더욱 높일 수 있습니다. 속도를 추구하면서도 결과 품질을 유지하는 것을 잊지 마세요. 균형이 핵심입니다. EvoX에 익숙해지면 성능 튜닝이 자연스러워질 것입니다.