MetaDE : faire évoluer l'évolution différentielle par l'évolution différentielle

L’évolution différentielle (Differential Evolution, DE), l’un des algorithmes fondamentaux du calcul évolutionnaire, a été largement utilisée dans les problèmes d’optimisation en boîte noire en raison de sa simplicité et de sa grande efficacité. Néanmoins, ses performances dépendent fortement du choix des hyperparamètres et des stratégies, un problème persistant pour les chercheurs. Pour relever ce défi, l’équipe EvoX a récemment publié une étude dans IEEE Transactions on Evolutionary Computation (IEEE TEVC) intitulée “MetaDE: Evolving Differential Evolution by Differential Evolution.” En tant que méthode méta-évolutionnaire qui exploite DE pour faire évoluer ses propres hyperparamètres et stratégies, MetaDE permet l’ajustement dynamique des paramètres et des stratégies tout en intégrant le calcul parallèle accéléré par GPU. Cette conception améliore considérablement l’efficacité computationnelle ainsi que les performances d’optimisation. Les résultats expérimentaux démontrent que MetaDE offre des performances remarquables tant sur la suite de benchmarks CEC2022 que sur les tâches de contrôle robotique. Le code source de MetaDE est disponible en open source sur GitHub à l’adresse https://github.com/EMI-Group/metade.

Contexte

Dans le domaine du calcul évolutionnaire, les performances des algorithmes sont souvent significativement influencées par le choix des hyperparamètres. Déterminer les réglages de paramètres les plus adaptés à un problème spécifique constitue un défi de recherche de longue date. L’évolution différentielle (DE), en tant qu’algorithme évolutionnaire classique, est largement appréciée pour sa simplicité et sa robuste capacité de recherche globale ; néanmoins, ses performances sont très sensibles au choix des hyperparamètres. Les méthodes conventionnelles reposent généralement soit sur un réglage basé sur l’expérience, soit sur des mécanismes adaptatifs pour améliorer les performances. Cependant, face à la diversité des scénarios de problèmes, ces approches peinent souvent à concilier efficacité et large applicabilité.

Le concept de “méta-évolution” a été introduit dès le siècle dernier, visant à utiliser les algorithmes évolutionnaires eux-mêmes pour optimiser les configurations d’hyperparamètres de ces algorithmes. Bien que la méta-évolution existe depuis de nombreuses années, son application pratique a été limitée par les exigences computationnelles élevées. Les avancées récentes dans le calcul GPU ont atténué ces contraintes, fournissant un solide support matériel pour les algorithmes évolutionnaires. En particulier, l’introduction du framework EvoX accéléré par GPU distribué a grandement facilité le développement d’algorithmes évolutionnaires basés sur GPU. Dans ce contexte, notre équipe de recherche a proposé une nouvelle approche de méta-évolution qui exploite DE pour faire évoluer ses propres hyperparamètres et stratégies, offrant ainsi une nouvelle voie pour résoudre le problème de longue date du réglage des paramètres dans les algorithmes évolutionnaires.

Qu’est-ce que la méta-évolution ?

L’idée centrale de la méta-évolution peut se résumer ainsi : “utiliser un algorithme évolutionnaire pour se faire évoluer lui-même” (Evolving an Evolutionary Algorithm by an Evolutionary Algorithm). Ce concept transcende les méthodes traditionnelles de calcul évolutionnaire en employant non seulement des algorithmes évolutionnaires pour rechercher les solutions optimales d’un problème, mais aussi en adaptant les hyperparamètres et les stratégies des algorithmes à travers leurs propres processus évolutionnaires.

En d’autres termes, la méta-évolution introduit un paradigme d‘“auto-évolution”, permettant aux algorithmes de s’optimiser eux-mêmes tout en explorant l’espace de recherche pour trouver des solutions aux problèmes. En se perfectionnant continuellement au cours du processus évolutionnaire, les algorithmes deviennent plus adaptatifs et peuvent maintenir une haute efficacité dans divers scénarios de problèmes.

Prenons MetaDE comme exemple : sa conception est ancrée dans cette philosophie. Dans une structure à deux couches, la couche inférieure (l‘“exécuteur”) résout le problème d’optimisation donné en utilisant un DE paramétré. La couche supérieure (l‘“évolveur”) emploie simultanément DE pour optimiser les configurations d’hyperparamètres de l’exécuteur. Ce cadre permet à DE non seulement de servir de solveur, mais aussi d‘“explorer” comment ajuster au mieux ses propres paramètres et stratégies pour résoudre plus efficacement différents problèmes. Un tel processus s’apparente à un système qui se comprend et se perfectionne progressivement — une transformation de “résoudre passivement un problème” à “s’auto-évoluer activement.” Par conséquent, il peut mieux s’adapter à des tâches diverses. Si nous considérons DE comme un système complexe, MetaDE permet effectivement une manière “récursive” d’auto-compréhension et d’auto-amélioration au sein de ce système.

Le terme “récursion” en informatique décrit généralement une fonction ou une procédure qui s’appelle elle-même. Au sein de MetaDE, ce concept prend un nouveau sens : il s’agit d’un mécanisme d’optimisation récursif interne qui emploie DE pour faire évoluer les hyperparamètres de DE. Ce schéma autoréférentiel incarne non seulement une puissante adaptativité, mais offre également une perspective nouvelle sur le théorème du “no free lunch”. Puisqu’il n’existe pas d’ensemble de paramètres universellement optimal pour tous les problèmes, permettre à l’algorithme de s’évoluer de manière autonome est la clé pour trouver les meilleures configurations de paramètres pour une tâche donnée.

Grâce à cette approche méta-évolutionnaire récursive, MetaDE obtient plusieurs avantages :

1. Réglage automatisé des paramètres

 Le processus laborieux de réglage manuel est éliminé. L'algorithme apprend lui-même à ajuster ses hyperparamètres, réduisant l'intervention humaine et améliorant l'efficacité.

2. Adaptabilité renforcée

 MetaDE répond dynamiquement aux caractéristiques et conditions changeantes des problèmes, modifiant les stratégies en temps réel pour améliorer les performances. Cela augmente considérablement la flexibilité de l'algorithme.

3. Recherche efficace En exploitant le parallélisme inhérent, MetaDE accélère considérablement les recherches dans les problèmes d’optimisation à grande échelle. Il fournit des solutions réalisables à des problèmes complexes de grande dimension dans des délais raisonnables.

Implémentation algorithmique

MetaDE emploie des techniques basées sur les tenseurs et l’accélération GPU pour permettre un calcul parallèle efficace. En traitant simultanément de nombreux individus d’une population, l’efficacité computationnelle globale est nettement améliorée, ce qui est particulièrement avantageux dans l’optimisation mono-objectif en boîte noire et les problèmes d’optimisation à grande échelle. Grâce à la tensorisation des paramètres clés et des structures de données (par exemple, population, fitness, paramètres de stratégie), MetaDE atteint non seulement une efficacité computationnelle supérieure, mais renforce également sa capacité à traiter des défis d’optimisation complexes. Comparé au DE classique et à d’autres algorithmes évolutionnaires (EAs), MetaDE montre des performances supérieures dans la résolution de problèmes à grande échelle. Grâce à l’approche basée sur les tenseurs, MetaDE exploite les ressources computationnelles plus efficacement, produisant des solutions plus rapides et des résultats d’optimisation plus précis que les méthodes traditionnelles.

Architecture PDE

L’équipe de recherche a d’abord proposé un cadre algorithmique DE paramétré (PDE) qui prend entièrement en charge les modifications de paramètres et de stratégies. Dans ce cadre, F et CR sont des paramètres continus, tandis que les autres paramètres sont discrets. Les boîtes en pointillés indiquent la plage des valeurs de paramètres autorisées. La fonction de mutation est dérivée des vecteurs de base gauche et droit, ainsi que du paramètre contrôlant le nombre de vecteurs de différence.

Architecture MetaDE

MetaDE adopte une structure à deux couches, comprenant un évolveur (couche supérieure) et plusieurs exécuteurs (couche inférieure). L’évolveur est un DE (ou potentiellement un autre algorithme évolutionnaire), responsable de l’optimisation des paramètres de PDE. Chaque individu x_i dans la population de l’évolveur correspond à une configuration de paramètres unique θ_i. Ces configurations sont transmises au PDE pour instancier différentes variantes de DE, chacune gérée par un exécuteur qui s’exécute indépendamment sur la tâche d’optimisation donnée. Chaque exécuteur renvoie sa meilleure valeur de fitness y^* à l’évolveur, qui attribue cette valeur de fitness y_i à l’individu correspondant x_i.

Performances expérimentales

Pour évaluer de manière exhaustive l’efficacité de MetaDE, l’équipe de recherche a réalisé des expériences systématiques couvrant plusieurs tests de benchmark et des scénarios réels. Chaque expérience utilisait un évolveur (DE avec la stratégie rand/1/bin) et des exécuteurs (PDE avec une taille de population de 100). Les composantes expérimentales clés comprennent :

Benchmark CEC2022 Comparaison de MetaDE avec diverses variantes de DE dans des tâches d’optimisation mono-objectif.

Comparaison avec les quatre meilleurs algorithmes CEC2022 Évaluation de MetaDE par rapport aux quatre algorithmes les plus performants de la compétition CEC2022 sous des budgets identiques d’évaluations de fonctions (FEs).

Évaluations de fonctions (FEs) sous temps d’exécution fixe Analyse de l’efficacité computationnelle de MetaDE sous accélération GPU.

Tâches de contrôle robotique Application de MetaDE aux tâches de contrôle robotique dans un environnement de la plateforme Brax pour valider son utilité pratique.

Benchmark CEC2022 : comparaison avec les variantes DE courantes

L’équipe a comparé MetaDE à plusieurs variantes représentatives de DE sur la suite de benchmarks CEC2022, notamment :

DE standard (rand/1/bin)
SaDE et JaDE (algorithmes DE adaptatifs)
CoDE (DE avec intégration de stratégies)
SHADE et LSHADE-RSP (DE adaptatif basé sur l’historique des succès)
EDEV (variantes DE intégrées)

Tous les algorithmes ont été implémentés sur la plateforme EvoX, utilisant l’accélération GPU avec une taille de population de 100 pour l’équité. Les expériences ont été menées sur différentes dimensionnalités (10D et 20D) sous la même contrainte de temps de calcul (60 secondes).

Résultats d’optimisation CEC2022 en 10D

Résultats d’optimisation CEC2022 en 20D

MetaDE atteint généralement une convergence plus rapide et plus stable sur la plupart des fonctions de test. Son DE paramétré (PDE) couplé à l’optimisation de la couche supérieure permet une adaptation dynamique aux différents espaces de problèmes, améliorant la robustesse globale et les performances de recherche.

Comparaison avec les quatre meilleurs algorithmes CEC2022 (sous FEs identiques)

Pour évaluer davantage la capacité d’optimisation de MetaDE, nous l’avons comparé aux quatre meilleurs algorithmes de la compétition CEC2022 dans le même budget d’évaluations de fonctions :

EA4eig : Une méthode hybride intégrant plusieurs EAs
NL-SHADE-LBC : Un DE adaptatif amélioré
NL-SHADE-RSP-MID : Un SHADE amélioré avec estimation du point médian
S-LSHADE-DP : Une variante de DE maintenant la diversité de la population par perturbation dynamique

Chacun de ces algorithmes a été exécuté avec ses paramètres officiels et son code source sous les mêmes contraintes de FEs. Des comparaisons statistiques (test de somme des rangs de Wilcoxon, niveau de significativité 0,05)

ont été effectuées entre MetaDE et chaque référence sur la suite de tests CEC2022. La dernière ligne du tableau montre les performances de chaque algorithme par rapport à MetaDE sur les différentes fonctions de test : + (significativement meilleur), ≈ (pas de différence significative) et − (significativement moins bon).

Comparaison des algorithmes de la compétition CEC2022 en 10D (mêmes FEs)

Comparaison des algorithmes de la compétition CEC2022 en 20D (mêmes FEs)

MetaDE démontre constamment de solides performances, en particulier sur les problèmes complexes nécessitant une convergence robuste. Grâce à son mécanisme auto-adaptatif, MetaDE ajuste efficacement sa stratégie pour différents paysages de recherche, améliorant ainsi l’efficacité de recherche et la capacité d’optimisation globale. Ces résultats indiquent que MetaDE surpasse non seulement les variantes DE courantes, mais présente également une forte compétitivité face aux algorithmes de compétition de premier plan.

Efficacité computationnelle : FEs dans un temps fixe (60 secondes)

L’équipe de recherche a également enregistré le nombre d’évaluations de fonctions (FEs) complétées par les différents algorithmes dans le même temps d’exécution fixe (60 secondes).

图片2.png

       FEs atteintes par chaque algorithme en 60 secondes

Sous le même framework EvoX avec calcul parallèle accéléré par GPU, MetaDE a atteint en moyenne des FEs de l’ordre de 10****⁹, tandis que les variantes DE traditionnelles n’atteignaient qu’environ 10^6 FEs. Cet avantage provient de l’approche paramétrée de MetaDE, qui effectue des évaluations parallèles à grande échelle des individus, permettant une utilisation plus efficace des ressources matérielles. Par conséquent, l’algorithme explore davantage de solutions dans la même fenêtre temporelle, améliorant à la fois la qualité des solutions et la stabilité.

Apprentissage par renforcement évolutionnaire : tâches de contrôle robotique

En apprentissage par renforcement (RL), l’efficacité et la stabilité de l’optimisation des politiques sont cruciales. Les méthodes basées sur le gradient telles que PPO et SAC peuvent souffrir de la disparition ou de l’explosion du gradient dans les environnements de grande dimension. En revanche, l’apprentissage par renforcement évolutionnaire (EvoRL) contourne ces problèmes en utilisant des recherches sans gradient pour optimiser directement les paramètres des politiques.

Processus d’apprentissage par renforcement évolutionnaire

Dans le cadre d’EvoRL, MetaDE :

Optimise automatiquement les paramètres des réseaux de neurones, augmentant l’adaptabilité des modèles de politiques.
Ajuste dynamiquement les hyperparamètres, améliorant la stabilité de l’entraînement.
Exploite l’accélération GPU pour accélérer l’optimisation des politiques.

Pour évaluer les performances de MetaDE sur des tâches d’optimisation complexes, nous l’avons appliqué à des problèmes de contrôle robotique en utilisant l’optimisation accélérée par GPU sur la plateforme de simulation Brax. L’étude comprenait trois tâches — Swimmer, Hopper et Reacher — chacune modélisée par un réseau de neurones entièrement connecté à trois couches (MLP) avec pour objectif de maximiser la récompense. Notamment, chaque MLP contient environ 1 500 paramètres, créant un défi d’optimisation en 1 500 dimensions pour les algorithmes évolutionnaires (EAs). Cela impose des exigences strictes tant en termes de capacité de recherche que d’efficacité computationnelle.

Courbes de convergence pour trois environnements Brax

Comme le montre la figure, MetaDE démontre de solides performances dans les tâches de contrôle robotique basées sur Brax, obtenant les meilleurs résultats sur la tâche Swimmer et des résultats quasi optimaux sur Hopper et Reacher. Son principal avantage réside dans la haute qualité de la population initiale, permettant une convergence rapide en phase initiale et produisant des solutions de haute qualité. Ces résultats suggèrent que MetaDE peut optimiser efficacement les politiques de réseaux de neurones, le rendant bien adapté aux tâches de contrôle robotique avec des simulations physiques complexes et offrant un large potentiel pour les applications pratiques.

Conclusion et perspectives

MetaDE est une approche innovante de méta-évolution qui excelle non seulement dans la résolution de tâches d’optimisation, mais aussi dans le réglage et le perfectionnement autonomes de ses propres stratégies. En capitalisant sur les forces de l’évolution différentielle, MetaDE présente un fort potentiel dans la configuration adaptative des paramètres et l’évolution des stratégies. Les résultats expérimentaux montrent une robustesse supérieure dans une gamme de tests de benchmark, et son applicabilité réelle est soulignée par son succès dans les tâches de contrôle robotique via l’apprentissage par renforcement évolutionnaire. Un défi central consiste à maintenir un équilibre optimal entre généralisation et spécialisation — en s’assurant que l’algorithme puisse s’adapter à des tâches diverses tout en optimisant efficacement pour des problèmes spécifiques. Cette recherche offre de nouvelles perspectives pour les algorithmes évolutionnaires auto-adaptatifs et pourrait stimuler de nouvelles avancées en méta-évolution pour les systèmes complexes.

Code open source et communauté

Article : https://arxiv.org/abs/2502.10470

GitHub : https://github.com/EMI-Group/metade

Projet amont (EvoX) : https://github.com/EMI-Group/evox

Groupe QQ : 297969717

Groupe QQ | Evolving Machine Intelligence

MetaDE est construit sur le framework EvoX. Si vous êtes intéressé par EvoX, veuillez consulter l’article sur EvoX 1.0 pour plus de détails.

(https://mp.weixin.qq.com/s/uT6qSqiWiqevPRRTAVIusQ)