EvoGO:GPU计算 × 生成式学习 → 10代收敛的演化算法新范式

近年来,数据驱动的演化优化方法取得了显著进展。从代理辅助的演化算法到生成式演化算法,演化优化正逐渐从传统的固定算子驱动范式向学习驱动范式转变。然而,现有方法在数据驱动的程度上仍存在三个重要的局限性。首先,生成机制与演化过程之间的协调通常仍依赖于人工设计的启发式规则。其次,生成模型的训练目标通常继承自通用的生成任务,与优化目标的一致性不足。第三,黑盒优化中极其有限却极具价值的在线样本尚未被系统地组织为可学习且可迁移的优化经验。为了解决这些问题,EvoX 团队提出了演化生成优化(EvoGO),将整个优化过程组织为三个统一的阶段:数据准备、模型训练和种群生成。其目的是使优化算法能够直接从历史数据中学习从劣质解向优质解进化的改进规律。实验结果表明,EvoGO 在数值优化、经典控制和高维机器人控制三大类任务中展现出稳定的优势,涵盖25个基准测试,问题规模从10维到1000维,在大部分大规模任务上大约10代即可收敛。在复杂任务中,结合 GPU 并行推理,EvoGO 还在实际运行时间上显示出显著优势;当 CMA-ES 达到其收敛性能时,EvoGO 达到相同性能的速度可达134倍。这些结果表明,完全数据驱动的演化优化不仅能在标准基准测试中取得有竞争力的结果,而且开始在大型并行任务上展现出实际优势。
困境:数据驱动优化仍未迈出最后一步
近年来,数据驱动的演化优化方法发展迅速。代理辅助方法和基于生成模型的方法已经将演化优化从固定算子驱动搜索推向了学习驱动搜索。这意味着学习模型已开始进入包括评估、建模甚至生成在内的多个流水线阶段。
然而,这种转变仍不彻底。现有方法可能在不同层面上学习了如何“评估”或“生成”,但并未真正学习如何“优化”。一方面,下一代候选解的产生通常仍依赖人工设计的启发式规则进行协调。另一方面,生成目标与优化目标往往不够一致。同时,黑盒优化中极其有限的在线样本尚未被系统地转化为可学习、可迁移的优化经验。
因此,当前真正缺失的不是更多的模型本身,而是最后一步:使优化算法能够直接从历史数据中学习从较差解向更好解演进的过程。这正是 EvoGO 试图推动的一步。
突破:EvoGO 如何重写优化流水线
为了解决上述问题,EvoGO 没有继续沿着改进交叉和变异等局部算子的传统路线走下去。相反,它试图在更整体的层面上重写优化流水线。其核心思想是将“如何生成下一代候选解”的过程从人工编写的规则中剥离出来,交给数据驱动的生成机制去学习。具体而言,EvoGO 将整个优化过程组织为三个统一的阶段——数据准备、模型训练和种群生成——从而使经验组织、方向学习和种群更新不再割裂,而是被整合到一个单一的优化循环中。

在数据准备阶段,EvoGO 首先从历史种群中筛选出高质量样本,以构建更可靠的训练基础。当样本稀缺时,还可以利用学习到的数据增强方法来缓解数据不足的问题。更重要的是,样本被进一步划分为优势解和劣势解,并组织成配对关系。结果,模型学习的不再仅仅是候选解的静态分布,而是从劣质解向优质解移动的方向关系。
在模型训练阶段,EvoGO 采用由代理模型、前向生成器和伪逆向生成器组成的配对结构。代理模型提供目标地形的近似表征;前向生成器学习从劣质解到优质解的映射;而伪逆向生成器通过重建一致性约束来保持训练的稳定性。与一般的生成任务不同,这里的训练目标不仅仅是拟合数据分布,而是在目标地形的引导下,确保生成过程向更好的区域移动。
在种群生成阶段,训练好的生成模型直接作用于当前种群,并行产生新一代的候选解。这些解随后由真实目标函数进行评估,并在进入下一次迭代之前更新种群状态。此时,种群更新的方式发生了根本性变化。传统的演化优化主要依赖人工指定的交叉、变异和选择规则来逐步探测搜索空间,而 EvoGO 则将这一过程转变为由历史数据驱动、由生成模型实现的并行更新机制。
EvoGO 的并行性体现在两个层面。一方面,种群可以用张量化形式表示,允许个体的生成和评估在 GPU 上并行运行。另一方面,EvoGO 也可以在单个 GPU 上同时运行多个生成模型,从而实现跨不同随机种子或不同问题实例的并行优化。因此,它的并行能力既存在于种群内部,也存在于多个种群之间。
从这个角度来看,EvoGO 的关键贡献不仅在于引入了生成模型,更在于将样本组织、目标对齐和种群更新统一在一个单一的方法论框架内。传统的演化优化强调由预写规则驱动的搜索,而 EvoGO 更进一步,试图让系统直接从历史数据中学习搜索过程本身。
验证:性能与机制分析
为了严格评估这种新的完全数据驱动范式的有效性,论文聚焦于三个关键问题:EvoGO 是否足够强大和高效?其成功背后的关键设计选择是什么?它展现出怎样的智能搜索行为?
1. 性能对比:“10代收敛”领跑基准测试
论文在数值优化、经典控制和高维机器人控制三大类任务上进行了系统评估,涵盖25个基准测试,问题维度从10到1000不等。EvoGO 与贝叶斯优化、经典演化策略、启发式方法以及先进的代理辅助方法进行了全面比较。


总体而言,EvoGO 在绝大多数任务上都展现出了明显的优势。值得注意的是,这种优势并不局限于低维或相对规则的问题。相反,随着问题维度和任务复杂度的增加,EvoGO 的优势往往变得更加明显。在低维和小样本条件下,一些最强的代理辅助方法仍然极具竞争力。但一旦问题变成高维、复杂且依赖于并行计算,EvoGO 的生成机制就能更充分地发挥作用,在大多数大规模任务上它可以在大约10代内收敛。这表明 EvoGO 的价值并不在于在某一种类型的问题上取得局部优势,而在于更适合复杂黑盒优化所需的大规模经验利用和并行搜索。

这在 Brax 中的高维机器人控制环境 Hopper 中表现得尤为明显。在相同的函数评估预算和运行时间预算下,EvoGO 显著优于 CMA-ES 和 TPE 等传统优化算法,同时也超越了需要与环境进行在线交互的 PPO 强化学习算法。更重要的是,得益于 GPU 等现代硬件的并行计算能力,EvoGO 可以在大约 500 秒内达到很高的奖励水平。当 CMA-ES 最终收敛到其最佳性能水平时,EvoGO 达到相同性能所需的实际时钟时间要短得多——最多可实现134倍的加速。这一结果表明,EvoGO 的优势不仅在于减少了迭代代数,更在于其搜索过程本身能更好地匹配并行计算资源,将原本分散在许多代中的优化动作压缩为高吞吐量的生成更新过程。
2. 消融实验:剖析成功的关键
为了验证 EvoGO“完全数据驱动”设计中核心组件的必要性,研究团队围绕配对生成架构、代理引导机制和面向优化的目标设计进行了系统的消融实验。构建了五个变体:单生成器版本、无代理版本、对抗目标版本、MLP代理版本和启发式代理版本。
实验结果表明,配对生成架构、代理引导机制和面向优化的目标设计对 EvoGO 的有效性都至关重要。移除伪逆向生成器会导致收敛稳定性明显变差、种群多样性降低,这表明由前向生成和逆向约束形成的配对结构对于保持训练稳定性和避免模式崩溃是必要的。移除代理模型,或将原始优化目标替换为通用对抗目标,也会导致显著的性能下降,说明代理引导和目标对齐是该方法优势的核心。将高斯过程替换为多层感知机或启发式规则后,方法仍能发挥作用,但整体性能略有下降,这表明 EvoGO 并不依赖特定的代理形式,尽管显式的不确定性建模对性能更有利。总体而言,EvoGO 的性能提升并非来自任何单一模块,而是源于配对生成架构、代理引导机制和面向优化的目标设计之间的协同作用。
3. 行为可视化:揭示数据驱动的动态过程
为了更直观地分析 EvoGO 的搜索动态,论文在二维 Ackley 函数上进行了可视化实验,种群规模设为 100。具体来说,在不同的演化代数中,记录了训练好的前向生成器对输入解的变换结果——即追踪了从输入解到输出解的映射过程。图中,箭头表示从输入解到输出解的向量,其颜色对应于向量长度。星号标记全局最优解,虚线框指示不同代数中生成的解所覆盖的区域。为了清晰起见,此可视化中省略了函数地形的平移和旋转设置。

可视化结果显示,EvoGO 学到的并不是无方向的随机扰动,而是随搜索阶段自适应变化的更新模式。在早期阶段,生成的向量通常较长,表明算法倾向于大幅度的全局探索。随着演化的进行,向量长度逐渐减小,生成的区域继续收缩,表明搜索转向更精细的局部利用。与此同时,向量整体上向最优区域聚集,这表明前向生成器已经从历史样本中提取出了具有实际意义的搜索方向。在行为层面上,这一现象支持了 EvoGO 的核心属性:它学习的不仅是候选解的分布,而是从当前状态向更好状态移动的更新规律。
应用:宽体客机超临界机翼工程验证
C919 的成功交付标志着中国在国产大飞机研制上迈出了关键一步。然而,作为单通道窄体客机,C919 主要服务于中短途航线,宽体客机领域仍需突破。为满足下一代国产宽体客机的研制需求,超临界机翼设计已成为气动优化中的关键问题,在降低巡航阻力、提高燃油效率和增强飞行稳定性方面发挥着重要作用。因此,如何实现高效可靠的超临界机翼优化已成为我国宽体客机研制过程中的核心技术挑战。

如原文献所示,通过优化更长的弦长、更平坦的上表面和增加的后缘弯度等几何特征,超临界机翼可以调节跨音速压力分布、抑制激波形成、降低波阻并提高升力效率。然而,其优化设计面临多重挑战。一方面,在宽体客机的高雷诺数条件下,设计必须同时满足升阻比、升力系数和巡航迎角等严格的气动约束,这对形状参数提出了极高的精度要求。另一方面,翼型几何形状与气动性能之间存在强非线性耦合关系,传统的建模方法难以准确表征。此外,现有的设计过程严重依赖经验、反复的 CFD 模拟和风洞实验,导致计算成本高、开发周期长,且难以在高维设计空间中有效逼近全局最优。

为了解决这一问题,EvoX 团队构建了一个基于 EvoGO 的集成设计流水线,包括性能评估、翼型生成和候选筛选。基于少量的历史翼型样本,该方法构建了性能评估模型、翼型生成模型和筛选模型,并通过迭代演化不断改进翼型设计。使用代理模型来准确预测升阻比、升力系数和巡航迎角等关键指标。同时,引入生成机制来取代传统的启发式搜索,从而能够在高维设计空间中高效逼近最优解。结合候选筛选策略,该方法可以从庞大的搜索空间中快速识别出既满足物理约束又符合气动性能要求的候选翼型,从而提高设计效率。

仅使用 500 个历史翼型样本,该方法在升阻比、升力系数和巡航迎角三个关键气动指标上的预测精度就达到了 99.5% 以上,自动生成的翼型的合格率超过 95%。这些结果表明,完全数据驱动的演化优化方法(如 EvoGO)不仅能在标准基准测试中表现出色,而且开始展现出为复杂实际工程问题提供有效设计支持的能力。
深化视野:从物理到哲学,重新解读 EvoGO
物理视角:从无序试错到有序演化
从物理的角度来看,黑盒优化可以理解为一个在真实但不可完全观测的势场中,逐步寻找更稳定状态的过程。对于优化器而言,目标函数及其适应度地形始终客观存在,但在初始时刻,系统只能通过有限的采样和评估获取局部知识。因此,搜索自然带有很高的不确定性。
传统的演化优化更多地依赖于局部扰动和随机试错。虽然它可以通过反复采样和选择逐渐逼近更好的区域,但搜索过程在很大程度上仍表现为高熵的局部探索,历史经验难以被系统地积累。EvoGO 的与众不同之处在于,它进一步将历史样本组织为编码了方向和结构的信息基础。代理模型提供了对局部目标地形的近似理解;优势解和劣势解的配对提取了从较差区域向更好区域移动的方向信息;而前向生成和逆向约束形成的循环使得这一方向性更新过程在保持稳定的同时能够持续展开。
用物理学术语来说,EvoGO 更像是一个在有效势场引导下有序结构逐渐形成的过程。它所做的不仅是加速搜索,而是在有限的观测能力下逐步降低搜索的不确定性,将种群更新从无序的试错转变为有组织的演化流。速度仅仅是结果;更深层的改变在于,历史经验开始被转化为可以积累、传递和重用的结构化信息。
哲学视角:从“道生万物”到规律生成
从哲学的角度来看,EvoGO 更值得强调的一点是,它体现了一个从经验到秩序、从局部到整体的生成过程。这个过程可以用经典的一句话来概括:“道生一,一生二,二生三,三生万物。”
**“道”**对应于目标问题中客观存在但无法被完全掌握的真实规律。在优化中,最优解不是由算法主观规定的;相反,它始终潜藏在真实的目标函数及其适应度地形中。算法能做的不是创造道,而是不断逼近它。
**“一”**对应于从杂乱的经验中提取出的统一结构。历史样本起初不过是散乱的搜索痕迹;它们并不会自动构成知识。只有当这些样本被分类、筛选和组织时,经验才开始从无序走向可学习的整体。这就是“生一”的含义。
**“二”**对应于分化——方向的出现。优势解和劣势解的划分不仅代表了好坏的区分;更重要的是,它标志着系统第一次从经验中获得了方向感。没有这种分化,经验只是堆积;有了它,经验就获得了演化的张力。
**“三”**对应于闭环——关系的生成。当目标认知、前向推进和逆向约束共同形成一个自洽的系统时,优化不再是局部操作的拼凑,而是开始形成一个能够自我维护和自我修正的完整机制。至此,该方法才真正具备了持续生成新解的能力。
**“万物”**则对应于在这个生成秩序之上不断涌现的新种群和新候选解。它们不是盲目产生的,而是在已经形成的方向、结构和闭环约束下持续生成的。正因如此,EvoGO 所推进的不仅仅是“更快地找到更好的解”的能力,而是演化优化从经验中生成规律,然后再不断从这些规律中生成解的新能力。
EvoGO 的哲学意义不在于简单地替换传统算子。相反,它在于更清晰地表明,优化不一定只靠预写规则来推进;通过经验的积累、分化和组织,它可以逐渐形成自身的生成秩序。
结论与展望
EvoGO 关注的不仅是对传统演化优化流水线的局部改进,更是对优化过程本身的根本性重构。通过将优化组织为数据准备、模型训练和种群生成三个统一的阶段,并引入基于优劣配对的方向性数据构建、代理引导的配对生成架构以及并行种群生成机制,EvoGO 在标准基准测试中展现出性能和效率两方面的稳定优势。同时,它也通过新一代宽体客机超临界机翼优化设计验证了其在复杂实际工程问题上的潜力。在更高的层面上,这项工作的意义在于表明,演化优化不一定必须局限于人工指定的启发式规则。优化过程本身可以作为一种可学习的规律,从历史经验中逐步提炼出来。
开源代码/社区
- 论文:
https://arxiv.org/abs/2602.01147 - GitHub:
https://github.com/EMI-Group/evogo - 上游项目(EvoX):
https://github.com/EMI-Group/evox - QQ群:
297969717 - 微信公众号: 进化智能(Evolutionary Machine Intelligence)
EvoGO 建立在 EvoX 框架之上。如果你对 EvoX 感兴趣,欢迎在 EvoX 公众号中查看相关文章(https://mp.weixin.qq.com/s/uT6qSqiWiqevPRRTAVIusQ)以获取更多详细信息。