4. 高级功能

EvoX 提供了许多高级功能以满足更复杂的需求。在熟悉了基础知识之后，本章将介绍如何自定义框架配置、管理可选插件模块以及优化性能——使你能够在必要时扩展和调优 EvoX。

自定义配置

EvoX 的默认设置适用于大多数情况，但有时你可能希望自定义框架的行为或参数。例如：

调整算法参数：除了基础的种群大小和迭代次数外，许多算法还暴露了高级参数。例如，CMA-ES 允许配置初始协方差矩阵，NSGA-II 暴露了拥挤距离参数。你可以将参数传递给算法的构造函数，例如 GA(crossover_prob=0.9, mutation_prob=0.1) 可自定义遗传算法中的交叉和变异概率。调整这些参数可以微调性能。请参阅 EvoX 文档中每个算法的 API，其中列出了可用参数和默认值。
替换算子组件：你可以替换内部的进化算子（例如选择或变异策略）。某些算法类支持传递自定义算子对象。例如，差分进化（DE）可能支持自定义变异算子，允许你提供自定义函数或 Operator 类。EvoX 的模块化设计支持这种“插件式”替换。这通常需要了解算法内部结构，对于标准用例通常不是必需的。
多目标设置：对于多目标优化，你可能需要配置偏好或权重——例如，为加权和方法设置权重向量，或在进化过程中调整参考点。这些配置通常通过问题或算法类中的参数暴露。例如，problem = DTLZ2(d=12, m=3) 定义了一个 12 维、3 目标的问题。某些算法允许传递自定义参考向量。阅读算法文档有助于你充分利用这些设置。
日志记录与输出：默认的 EvalMonitor 已经记录了关键的优化指标。如果你需要额外信息（例如种群多样性或每代的平均适应度），你可以自定义监控器或在循环中手动记录。对于长时间运行的任务，你可能希望将日志记录到文件中。这可以使用 Python 的 logging 库或简单的文件 I/O 来追加结果，以便稍后分析。

总之，自定义配置意味着针对特定任务修改 EvoX 的默认行为。这通常涉及更深入地使用 EvoX 的 API。我们将在开发与扩展部分介绍更多内容。对于初学者，只需记住：EvoX 提供了灵活的接口，允许有经验的用户调整几乎每一个细节——但你也可以坚持使用默认设置并快速获得结果。

插件管理

这里的“插件”指的是 EvoX 中的可选组件或扩展模块——例如可视化工具、强化学习环境包装器以及 EvoX 生态系统中的兄弟项目。在 EvoX 中管理插件主要涉及安装和使用可选模块。以下是一些关键扩展及其管理方法：

可视化插件：EvoX 包含 evox.vis_tools 模块，其中包含用于绘图的 plot 子模块，并支持用于实时数据流的 .exv 日志格式。要使用可视化功能，请安装带有 vis 额外组件的 EvoX：pip install evox[vis]。（如果最初未安装，你可以稍后安装，或者直接运行 pip install plotly 以满足依赖关系。）使用可视化工具时，通常在监控器记录数据后调用绘图函数——例如，EvalMonitor.plot() 使用 vis_tools.plot。确保安装此插件可避免因缺少 matplotlib 等库而导致的错误。
神经进化插件：EvoX 支持强化学习环境（如 Brax 物理引擎）和神经个体优化（神经进化）。这些功能捆绑在 neuroevolution 扩展中，通过 pip install "evox[neuroevolution]" 安装。这包括 Google Brax 库、Gym 等。安装后，你可以使用 evox.problems.neuroevolution 中的 BraxProblem 等包装器将 RL 环境转化为优化问题。还包括像 ParamsAndVector 这样的工具，用于将 PyTorch 模型参数展平为向量以进行进化。请注意，Brax 仅在 Linux 或通过 WSL 的 Windows 上工作——原生 Windows Python 可能只能在 CPU 上运行。简而言之，启用或禁用 EvoX 插件是通过安装特定的额外组件来控制的。
兄弟项目：EvoX 拥有相关项目，如 EvoRL（专注于进化强化学习）和 EvoGP（GPU 加速的遗传规划）。这些项目共享 EvoX 的设计理念和接口。如果你的任务侧重于 RL，你可能更喜欢这些专用框架。管理这些插件意味着确保版本兼容性并满足依赖关系。例如，EvoRL 使用 JAX 和 Brax，而 EvoGP 可能需要符号树库。这些库通常可以共存而不会发生冲突。可以将它们视为可从主 EvoX 项目调用的互补工具——或者为了精简设置而完全不使用。
自定义插件：得益于 EvoX 的模块化，你可以构建自己的“插件”。例如，创建一个自定义 Monitor 类来跟踪独特的指标，或创建一个包装第三方模拟器的自定义 Problem 子类。这些有效地扩展了 EvoX 的能力。最佳实践是遵循 EvoX 的接口契约——例如，确保你的自定义 Problem 有一个 evaluate() 方法，或者你的自定义 Monitor 继承自基类。经过测试后，你甚至可以将其贡献给 EvoX 的未来版本。

总体而言，EvoX 中的插件管理关乎灵活扩展与依赖控制。作为初学者，在安装过程中，你可以决定是否包含 vis 和 neuroevolution 扩展。如果最初未安装，稍后也可以添加。有了插件，你可以更轻松地监控优化进度，并将 EvoX 与外部工具集成以获得更强大的功能。

性能优化

性能是 EvoX 的一大优势。即使使用相同的算法，EvoX 的 GPU 支持也可以将速度提高几个数量级。然而，要充分利用这一点，你需要遵循一些技巧：

利用 GPU 并行：首先，确保你的代码实际上是在 GPU 上运行的。如前所述，安装支持 CUDA 的 PyTorch 并将数据移动到 GPU 设备。如果感觉速度慢，请使用 torch.cuda.is_available() 检查——它应该返回 True。如果存在 GPU 但未被使用，很可能是因为张量默认是在 CPU 上创建的。通过显式设置 device，或确保输入张量（如 lb/ub）在 CUDA 上来解决此问题。EvoX 将跟随这些输入的设备。在多 GPU 系统上，EvoX 通常每个进程使用一个 GPU。要利用多个 GPU，你可以运行使用不同 GPU 的多个进程，或者等待未来对协调多 GPU 执行的支持。
并行评估：进化算法的一个关键瓶颈是适应度评估。由于评估通常是独立的，因此可以并行化。EvoX 会尽可能批量处理评估——例如，神经网络评估或多项式函数可以使用 GPU 并行计算。对于自定义问题，避免使用 Python 循环——向量化你的评估代码以一次处理整批候选解。这充分利用了 PyTorch 的并行能力。简单来说：让你的问题的 evaluate() 函数对批次（而不是单个解）进行操作，以获得巨大的速度提升。
编译优化：PyTorch 2.0 引入了 torch.compile，它可以对模型/函数进行 JIT 编译以获得性能提升。如果你的评估逻辑很复杂，请考虑在运行前进行编译：
```
jit_state_step = torch.compile(workflow.step())
```
这可能会显著提高性能。

注意： 编译会增加开销，并不总是支持所有函数或问题。最适合大规模、长时间运行的任务。在 Windows 上，确保安装了 Triton 以使 torch.compile 正常工作。
调整种群大小：较大的种群增加了多样性和全局搜索能力——但也增加了每一代的计算量。通过调整 pop_size 来平衡质量和速度。在 GPU 上，你通常可以在不增加线性时间成本的情况下增加它（得益于并行性）。但过大的尺寸会导致内存问题。如果 GPU 内存不足，请减小种群大小或问题维度，或使用 FP16 以节省空间（通过 torch.set_float32_matmul_precision('medium') 设置）。
减少 Python 开销：EvoX 将大多数核心计算转移到 torch.Tensor，但用户编写的循环或自定义算子应避免过多的 Python 级操作。避免频繁打印（高 I/O 成本）、列表或数据类型转换。保持代码向量化/张量化，以利用底层快速的 C++/CUDA 内核并减少 Python 解释器开销。
分布式部署：对于超大型问题，考虑跨多台机器运行。EvoX 支持多节点设置（通过后端通信和分片）。虽然这对初学者来说不太友好，但了解它的存在是有好处的。对于 GPU 集群，请参阅 EvoX 的分布式部署文档。通常，你需要设置环境变量或使用特殊脚本启动。该架构允许相同的代码在单节点或多节点设置上运行。对于你的第一次尝试，可以在一台机器上使用多个进程进行模拟。
性能分析：要深入了解，请使用 PyTorch 的分析器或 Python 的 cProfile 等工具来分析瓶颈。这有助于你确定时间是花在评估、选择还是其他方面——以便你可以相应地进行优化（例如，通过缓存重复计算）。EvoX 专为性能而构建，但实际任务仍可能遇到需要分析的独特瓶颈。

简而言之，虽然 EvoX 在架构层面已经进行了优化，但用户可以通过正确使用 GPU、批量计算和调整参数来进一步提升性能。在追求速度的同时，也要记得保持结果质量——平衡是关键。随着你对 EvoX 越来越熟悉，性能调优将变得第二天性。