EvoGO: Computação em GPU × Aprendizado Generativo → Um Novo Paradigma para Algoritmos Evolutivos com Convergência em 10 Gerações

Nos últimos anos, os métodos de otimização evolutiva baseados em dados fizeram um progresso notável. Desde algoritmos evolutivos assistidos por modelos substitutos (surrogate) até algoritmos evolutivos generativos, a otimização evolutiva tem mudado gradualmente de paradigmas tradicionais guiados por operadores fixos para paradigmas guiados por aprendizado. No entanto, a natureza orientada a dados dos métodos existentes permanece incompleta em três aspectos importantes. Primeiro, a coordenação entre o mecanismo generativo e o processo evolutivo ainda depende frequentemente de regras heurísticas projetadas manualmente. Segundo, os objetivos de treinamento dos modelos generativos são geralmente herdados de tarefas de geração de uso geral e não estão suficientemente alinhados com os objetivos de otimização. Terceiro, as amostras online extremamente limitadas, mas altamente valiosas, disponíveis na otimização de caixa preta ainda não foram organizadas sistematicamente em experiência de otimização que pode ser aprendida e transferida. Para resolver esses problemas, a equipe EvoX propôs a Otimização Generativa Evolutiva (EvoGO), que organiza todo o processo de otimização em três etapas unificadas: preparação de dados, treinamento do modelo e geração da população. O objetivo é permitir que os algoritmos de otimização aprendam diretamente a lei de melhoria que consiste em passar de soluções inferiores para soluções superiores a partir de dados históricos. Os resultados experimentais mostram que o EvoGO demonstra vantagens estáveis em três categorias de tarefas — otimização numérica, controle clássico e controle robótico de alta dimensão — cobrindo 25 testes de referência (benchmarks) e escalas de problemas variando de 10 a 1000 dimensões, convergindo na maioria das tarefas de larga escala em cerca de 10 gerações. Em tarefas complexas, quando combinado com a inferência paralela em GPU, o EvoGO também mostra vantagens práticas significativas no tempo de execução; quando o CMA-ES atinge o seu desempenho convergente, o EvoGO consegue atingir o mesmo desempenho até 134 vezes mais rápido. Esses resultados indicam que a otimização evolutiva totalmente orientada a dados não apenas pode alcançar resultados competitivos em testes de referência padrão, mas também começa a reescrever o próprio processo de busca.

O Dilema: A Otimização Orientada a Dados Ainda Não Deu o Último Passo

Nos últimos anos, os métodos de otimização evolutiva baseados em dados desenvolveram-se rapidamente. Os métodos assistidos por substitutos e os métodos baseados em modelos generativos já impulsionaram a otimização evolutiva de uma busca guiada por operadores fixos para uma busca guiada pelo aprendizado. Isso significa que os modelos de aprendizado começaram a entrar em várias etapas do fluxo de trabalho, incluindo a avaliação, a modelagem e até a geração.

No entanto, essa transformação ainda está incompleta. Os métodos existentes podem ter aprendido a “avaliar” ou a “gerar” em diferentes níveis, mas ainda não aprenderam verdadeiramente a “otimizar”. Por um lado, a produção da próxima geração de soluções candidatas ainda depende frequentemente de regras heurísticas projetadas manualmente para coordenação. Por outro lado, o objetivo da geração e o objetivo da otimização estão muitas vezes insuficientemente alinhados. Ao mesmo tempo, as amostras online extremamente limitadas disponíveis na otimização de caixa preta ainda não foram sistematicamente transformadas em experiência de otimização aprendível e transferível.

Portanto, o que verdadeiramente falta hoje não são mais modelos em si, mas sim o passo final: permitir que os algoritmos de otimização aprendam diretamente o processo de passar de soluções piores para soluções melhores a partir de dados históricos. É exatamente este passo que o EvoGO procura dar.

A Inovação: Como o EvoGO Reescreve o Fluxo de Otimização

Para resolver os problemas mencionados acima, o EvoGO não continua pelo caminho tradicional de melhorar os operadores locais, como o cruzamento e a mutação. Em vez disso, tenta reescrever o fluxo de otimização em um nível mais holístico. Sua ideia central é remover o processo de “como gerar a próxima geração de soluções candidatas” das regras escritas manualmente e entregá-lo a um mecanismo generativo orientado a dados para que este aprenda. Especificamente, o EvoGO organiza todo o processo de otimização em três etapas unificadas — preparação de dados, treinamento do modelo e geração da população — para que a organização da experiência, o aprendizado direcional e a atualização da população deixem de ser fragmentados e passem a ser integrados em um único ciclo de otimização.

Na etapa de preparação de dados, o EvoGO primeiro filtra amostras de alta qualidade de populações históricas para construir uma base de treinamento mais confiável. Quando as amostras são escassas, o aumento de dados aprendido (learned augmentation) também pode ser usado para mitigar a escassez de dados. Mais importante ainda, as amostras são subdivididas em soluções superiores e inferiores e organizadas em relações pareadas. Como resultado, o que o modelo aprende já não é apenas uma distribuição estática de soluções candidatas, mas sim a relação direcional da passagem de soluções inferiores para soluções superiores.

Na etapa de treinamento do modelo, o EvoGO adota uma estrutura pareada que consiste em um modelo substituto, um gerador direto (forward generator) e um gerador pseudo-inverso. O modelo substituto fornece uma caracterização aproximada do panorama do objetivo (objective landscape); o gerador direto aprende o mapeamento das soluções inferiores para as superiores; e o gerador pseudo-inverso mantém a estabilidade do treinamento por meio de uma restrição de consistência de reconstrução. Ao contrário das tarefas gerais de geração, o objetivo do treinamento aqui não é meramente se ajustar à distribuição de dados, mas garantir que o processo de geração avance em direção a regiões melhores sob a orientação do panorama do objetivo.

Na etapa de geração da população, o modelo generativo treinado atua diretamente sobre a população atual para produzir uma nova geração de soluções candidatas em paralelo. Essas soluções são depois avaliadas pela função objetivo real, e o estado da população é atualizado de acordo antes de entrar na iteração seguinte. Neste ponto, a forma como as atualizações da população são executadas muda fundamentalmente. A otimização evolutiva tradicional depende principalmente de regras de cruzamento, mutação e seleção especificadas manualmente para explorar gradualmente o espaço de busca, enquanto o EvoGO transforma esse processo em um mecanismo de atualização paralela impulsionado por dados históricos e implementado por um modelo generativo.

O paralelismo do EvoGO opera em dois níveis. Por um lado, a população pode ser representada em uma forma tensorizada, permitindo que a geração e a avaliação de indivíduos sejam executadas em paralelo na GPU. Por outro lado, o EvoGO também pode executar vários modelos generativos simultaneamente em uma única GPU, permitindo a otimização paralela através de diferentes sementes aleatórias (random seeds) ou diferentes instâncias de problemas. Sua capacidade paralela, portanto, existe tanto dentro das populações quanto através de múltiplas populações.

Desta perspectiva, a principal contribuição do EvoGO não é simplesmente a introdução de um modelo generativo, mas a unificação da organização de amostras, alinhamento de objetivos e atualização de populações dentro de uma única estrutura metodológica. A otimização evolutiva tradicional enfatiza a busca impulsionada por regras pré-escritas, ao passo que o EvoGO dá um passo além ao tentar deixar o sistema aprender o próprio processo de busca diretamente a partir de dados históricos.

Validação: Avaliação de Desempenho e Análise Mecanística

Para avaliar rigorosamente a eficácia deste novo paradigma totalmente baseado em dados, o artigo concentra-se em três questões essenciais: O EvoGO é suficientemente poderoso e eficiente? Quais são as escolhas de design cruciais por trás do seu sucesso? Que comportamento de busca inteligente ele exibe?

1. Comparação de Desempenho: A “Convergência em 10 Gerações” Lidera nos Benchmarks

O artigo realiza uma avaliação sistemática em três categorias de tarefas — otimização numérica, controle clássico e controle robótico de alta dimensão — cobrindo 25 testes de referência com dimensões de problemas variando de 10 a 1000. O EvoGO é comparado de forma abrangente com a otimização bayesiana, estratégias de evolução clássicas, métodos heurísticos e métodos avançados assistidos por substitutos.

No geral, o EvoGO demonstra vantagens claras na maioria das tarefas. Notavelmente, essa vantagem não se restringe a problemas de baixa dimensão ou relativamente regulares. Pelo contrário, à medida que a dimensionalidade do problema e a complexidade da tarefa aumentam, a vantagem do EvoGO torna-se frequentemente mais pronunciada. Sob condições de baixa dimensão e amostras pequenas, alguns dos métodos assistidos por substitutos mais fortes permanecem altamente competitivos. Mas quando os problemas se tornam de alta dimensão, complexos e dependentes de computação paralela, o mecanismo generativo do EvoGO consegue se expandir mais plenamente, e na maioria das tarefas de larga escala ele pode convergir em cerca de 10 gerações. Isso sugere que o valor do EvoGO não reside em alcançar a superioridade local em um único tipo de problema, mas em estar mais bem adaptado à utilização de experiência em larga escala e à busca paralela exigidas pela otimização complexa de caixa preta.

Isso é especialmente evidente no ambiente de controle robótico de alta dimensão Hopper no Brax. Com o mesmo orçamento de avaliação de funções e orçamento de tempo de execução, o EvoGO supera significativamente os algoritmos de otimização tradicionais, como o CMA-ES e o TPE, e também supera o algoritmo de aprendizado por reforço PPO, que requer interação online com o ambiente. Mais importante ainda, graças ao poder de computação paralela de hardware moderno, como GPUs, o EvoGO consegue atingir um nível de recompensa elevado em cerca de 500 segundos. Quando o CMA-ES finalmente converge para o seu melhor nível de desempenho, o tempo real de relógio (wall-clock time) necessário para o EvoGO atingir o mesmo desempenho é muito mais curto — uma aceleração de até 134 vezes. Esse resultado mostra que a vantagem do EvoGO não está apenas na redução do número de gerações, mas no fato de que o seu próprio processo de busca está mais bem ajustado aos recursos de computação paralela, comprimindo ações de otimização que, de outra forma, se espalhariam por muitas gerações em um processo de atualização generativa de alto rendimento.

2. Estudo de Ablação: Dissecando as Chaves para o Sucesso

Para verificar a necessidade dos componentes centrais no design “totalmente orientado a dados” do EvoGO, a equipe de pesquisa conduziu ablações sistemáticas focadas na arquitetura generativa pareada, no mecanismo de orientação por substitutos e no design de objetivos orientado para a otimização. Foram construídas cinco variantes: uma versão de gerador único, uma versão sem substituto, uma versão de objetivo adversarial, uma versão de substituto MLP e uma versão de substituto heurístico.

Os resultados experimentais revelam que a arquitetura generativa pareada, o mecanismo de orientação por substitutos e o design de objetivos orientado para a otimização são todos cruciais para a eficácia do EvoGO. A remoção do gerador pseudo-inverso leva a uma estabilidade de convergência visivelmente pior e a uma redução da diversidade da população, indicando que a estrutura pareada formada pela geração direta e por restrições inversas é necessária para manter a estabilidade do treinamento e evitar o colapso de modo (mode collapse). A remoção do modelo substituto, ou a substituição do objetivo de otimização original por um objetivo adversarial geral, também causa uma degradação significativa no desempenho, demonstrando que a orientação por substitutos e o alinhamento de objetivos são centrais para a vantagem do método. A substituição do processo Gaussiano por um perceptron multicamadas (MLP) ou por regras heurísticas ainda deixa o método funcional, mas com um leve declínio geral, indicando que o EvoGO não depende de uma forma específica de substituto, embora a modelagem explícita da incerteza seja mais benéfica para o desempenho. Globalmente, os ganhos de desempenho do EvoGO não vêm de um único módulo, mas sim da sinergia entre a arquitetura generativa pareada, o mecanismo de orientação por substitutos e o design de objetivos orientado para a otimização.

3. Visualização de Comportamento: Revelando um Processo Dinâmico Orientado a Dados

Para analisar de forma mais intuitiva a dinâmica de busca do EvoGO, o artigo apresenta um experimento de visualização na função de Ackley bidimensional, com o tamanho da população definido como 100. Especificamente, em diferentes gerações evolutivas, os resultados da transformação do gerador direto treinado nas soluções de entrada são registrados — ou seja, o processo de mapeamento das soluções de entrada para as soluções de saída é rastreado. Na figura, as setas representam vetores desde as soluções de entrada até as soluções de saída, e as suas cores correspondem aos comprimentos dos vetores. A estrela marca o ótimo global e as caixas tracejadas indicam as regiões cobertas pelas soluções geradas em diferentes gerações. Para maior clareza, as configurações de translação e rotação do panorama da função foram omitidas nesta visualização.

Os resultados da visualização mostram que o que o EvoGO aprende não é uma perturbação aleatória sem direção, mas um padrão de atualização que se adapta à fase de busca. Na fase inicial, os vetores gerados são geralmente mais longos, indicando que o algoritmo tende a uma exploração global de grande amplitude. À medida que a evolução avança, os comprimentos dos vetores diminuem gradualmente e as regiões geradas continuam a se contrair, demonstrando que a busca se desloca para uma exploração (exploitation) local mais fina. Ao mesmo tempo, os vetores como um todo se reúnem em direção à região ótima, o que indica que o gerador direto já extraiu uma direção de busca com significado prático a partir de amostras históricas. Em nível comportamental, esse fenômeno apoia a propriedade central do EvoGO: ele não aprende meramente a distribuição de soluções candidatas, mas a lei de atualização que passa do estado atual para um estado melhor.

Aplicação: Validação de Engenharia em uma Asa Supercrítica de um Avião Comercial de Fuselagem Larga

A entrega bem-sucedida do C919 marca um passo crucial para a China no desenvolvimento de grandes aviões de produção nacional. Contudo, como avião de corredor único (fuselagem estreita), o C919 atende principalmente a rotas de curto e médio curso, e ainda são necessários avanços no domínio dos aviões de fuselagem larga. Para atender às necessidades de desenvolvimento da próxima geração de aviões de fuselagem larga nacionais, o projeto de asas supercríticas tornou-se um tema-chave na otimização aerodinâmica, desempenhando um papel importante na redução do arrasto de cruzeiro, na melhoria da eficiência de combustível e no aumento da estabilidade de voo. Por conseguinte, a forma de alcançar uma otimização eficiente e confiável de asas supercríticas tornou-se um desafio técnico central no processo de desenvolvimento de aviões de fuselagem larga da China.

Como demonstrado no artigo original, ao otimizar características geométricas como uma corda mais longa, uma superfície superior mais plana e o aumento da curvatura do bordo de fuga, uma asa supercrítica pode regular a distribuição de pressão transônica, suprimir a formação de ondas de choque, reduzir o arrasto de onda e melhorar a eficiência de sustentação. No entanto, o seu projeto ideal enfrenta vários desafios. Por um lado, sob condições de alto número de Reynolds em aviões de fuselagem larga, o design precisa satisfazer simultaneamente restrições aerodinâmicas rigorosas, como a relação sustentação/arrasto, o coeficiente de sustentação e o ângulo de ataque de cruzeiro, o que impõe exigências de precisão extremamente elevadas aos parâmetros de forma. Por outro lado, existe uma forte relação de acoplamento não linear entre a geometria do perfil aerodinâmico (airfoil) e o desempenho aerodinâmico, algo difícil de caracterizar com precisão por meio de métodos tradicionais de modelagem. Além disso, o atual processo de design depende fortemente da experiência, de repetidas simulações de CFD e de experimentos em túnel de vento, levando a altos custos computacionais, longos ciclos de desenvolvimento e à dificuldade de se aproximar efetivamente do ótimo global em um espaço de design de alta dimensão.

Para resolver esse problema, a equipe EvoX construiu um fluxo de trabalho de design integrado com base no EvoGO, consistindo em avaliação de desempenho, geração de perfis aerodinâmicos e seleção de candidatos. Com base em um pequeno número de amostras históricas de perfis aerodinâmicos, o método constrói um modelo de avaliação de desempenho, um modelo de geração de perfis e um modelo de triagem, melhorando continuamente o design do perfil por meio de evolução iterativa. Um modelo substituto é usado para prever com precisão métricas cruciais, como a relação sustentação/arrasto, o coeficiente de sustentação e o ângulo de ataque de cruzeiro. Paralelamente, é introduzido um mecanismo generativo para substituir a busca heurística tradicional, permitindo uma aproximação eficiente do ótimo em um espaço de design de alta dimensão. Em conjunto com uma estratégia de triagem de candidatos, este método consegue identificar rapidamente perfis potenciais que atendem simultaneamente às restrições físicas e aos requisitos de desempenho aerodinâmico a partir de um vasto espaço de busca, melhorando assim a eficiência do design.

Recorrendo a apenas 500 amostras históricas de perfis aerodinâmicos, o método atinge mais de 99,5% de precisão de previsão em três indicadores aerodinâmicos chave — relação sustentação/arrasto, coeficiente de sustentação e ângulo de ataque de cruzeiro — e a taxa de qualificação dos perfis gerados automaticamente ultrapassa 95%. Esses resultados indicam que os métodos de otimização evolutiva totalmente orientados a dados, como o EvoGO, não apenas podem obter bons resultados em testes de referência padrão, mas também estão começando a demonstrar a capacidade de fornecer suporte eficaz ao design em problemas reais de engenharia.

Aprofundando a Visão: Da Física à Filosofia, Reinterpretando o EvoGO

Perspectiva Física: De “Tentativa e Erro” Desordenado para a Evolução Ordenada

De uma perspectiva física, a otimização de caixa preta pode ser entendida como um processo de procurar gradualmente um estado mais estável dentro de um campo de potencial real, mas incompletamente observável. Para o otimizador, a função objetivo e a sua paisagem de aptidão (fitness landscape) existem objetivamente em todos os momentos, mas no momento inicial o sistema apenas pode obter conhecimento local através de amostragem e avaliação limitadas. A busca acarreta, portanto, naturalmente uma alta incerteza.

A otimização evolutiva tradicional depende mais de perturbação local e de tentativa e erro aleatória. Embora ela possa se aproximar progressivamente de regiões melhores por meio de amostragem e seleção repetidas, o processo de busca ainda se manifesta grandemente como uma exploração local de alta entropia, e a experiência histórica é difícil de ser acumulada sistematicamente. O que distingue o EvoGO é que ele vai além, organizando amostras históricas em uma base de informação que codifica a direção e a estrutura. O modelo substituto fornece uma compreensão aproximada da paisagem do objetivo local; o pareamento de soluções superiores e inferiores extrai informação direcional sobre a passagem de regiões piores para regiões melhores; e o ciclo formado pela geração direta e restrições inversas permite que esse processo de atualização direcional se desenrole continuamente, mantendo-se estável.

Em termos físicos, o EvoGO assemelha-se mais a um processo no qual uma estrutura ordenada se forma gradualmente sob a orientação de um campo de potencial eficaz. O que ele faz não é meramente acelerar a busca, mas sim reduzir de forma progressiva a incerteza da busca sob observabilidade limitada, transformando a atualização da população de tentativa e erro desordenada em um fluxo evolutivo organizado. A velocidade é apenas o resultado; a mudança mais profunda reside no fato de que a experiência histórica começa a ser transformada em informação estrutural que pode ser acumulada, transmitida e reutilizada.

Perspectiva Filosófica: Do “Dao Dá Origem a Todas as Coisas” à Geração de Leis

Do ponto de vista filosófico, o que é ainda mais digno de nota em relação ao EvoGO é que ele incorpora um processo generativo que avança da experiência para a ordem, e do local para o todo. Esse processo pode ser resumido por meio da frase clássica: “O Dao dá origem ao Um, o Um dá origem ao Dois, o Dois dá origem ao Três, e o Três dá origem a todas as coisas.”

O “Dao” corresponde à verdadeira lei, objetivamente existente, mas não totalmente apreensível, do problema-alvo. Na otimização, a solução ótima não é prescrita subjetivamente pelo algoritmo; em vez disso, está sempre latente na função objetivo real e em sua paisagem de aptidão. O que o algoritmo pode fazer não é criar o Dao, mas apenas se aproximar continuamente dele.

O “Um” corresponde à estrutura unificada extraída da experiência desordenada. Inicialmente, as amostras históricas não são mais do que traços dispersos da busca; elas não constituem conhecimento automaticamente. Apenas quando essas amostras são ordenadas, filtradas e organizadas é que a experiência começa a evoluir da desordem para um todo que pode ser aprendido. Este é o sentido de “dar origem ao Um”.

O “Dois” corresponde à diferenciação — ao surgimento de direção. A divisão entre soluções superiores e inferiores não representa meramente a distinção entre bom e ruim; mais importante, assinala a primeira vez que o sistema adquire um senso de direção por meio da experiência. Sem essa diferenciação, a experiência é apenas acumulada; com ela, a experiência ganha uma tensão evolutiva.

O “Três” corresponde ao fechamento — à geração de relações. Quando a cognição objetiva, a progressão direta e a restrição de retrocesso formam em conjunto um sistema autoconsistente, a otimização deixa de ser uma colagem de operações locais e começa a tomar a forma de um mecanismo integral, capaz de automanutenção e autocorreção. Neste momento, o método adquire verdadeiramente a capacidade de gerar novas soluções de forma contínua.

As “todas as coisas” correspondem, então, às novas populações e às novas soluções candidatas que emergem de forma ininterrupta sobre essa ordem generativa. Elas não são produzidas de forma cega, mas surgem continuamente dentro de uma direção, estrutura e restrições de ciclo fechado já consolidadas. É precisamente por esse motivo que o avanço proporcionado pelo EvoGO não se resume à capacidade de “encontrar soluções melhores com maior rapidez”, mas sim a uma nova aptidão para a otimização evolutiva gerar leis a partir da experiência e, subsequentemente, gerar soluções de forma contínua a partir dessas leis.

O significado filosófico do EvoGO não se encontra na simples substituição dos operadores tradicionais. Em vez disso, reside em demonstrar mais claramente que a otimização não precisa ser conduzida apenas por regras preestabelecidas; por meio da acumulação, diferenciação e organização da experiência, a otimização pode gradualmente formar a sua própria ordem generativa.

Conclusão e Perspectivas

O foco do EvoGO não é apenas uma melhoria local do fluxo tradicional de otimização evolutiva, mas sim uma reconstrução mais fundamental do modo como a própria otimização acontece. Ao organizar a otimização nas três etapas unificadas de preparação de dados, treinamento do modelo e geração de população, e ao introduzir a construção de dados direcionais baseada no pareamento superior-inferior, uma arquitetura generativa pareada guiada por substitutos e um mecanismo paralelo de geração de população, o EvoGO demonstra vantagens consistentes, tanto em desempenho quanto em eficiência, em testes de referência padrão. Ao mesmo tempo, também validou seu potencial para resolver problemas reais e complexos de engenharia por meio da otimização do design de asas supercríticas para a próxima geração de aviões comerciais de fuselagem larga. Em um nível mais alto, o valor deste trabalho está em mostrar que a otimização evolutiva não tem necessariamente que permanecer confinada a regras heurísticas definidas manualmente. O próprio processo de otimização pode ser progressivamente extraído da experiência histórica como uma lei que pode ser aprendida.

Código Open-Source / Comunidade

Artigo (Paper):
https://arxiv.org/abs/2602.01147
GitHub:
https://github.com/EMI-Group/evogo
Projeto Inicial (Upstream) (EvoX):
https://github.com/EMI-Group/evox
Grupo QQ: 297969717
Conta Oficial do WeChat: Evolutionary Machine Intelligence

O EvoGO é desenvolvido sobre a base do framework EvoX. Se você estiver interessado no EvoX, está convidado a conferir os artigos (https://mp.weixin.qq.com/s/uT6qSqiWiqevPRRTAVIusQ) na conta pública do EvoX para obter mais detalhes.