6. 故障排除与优化

在使用 EvoX 时，您可能会遇到问题或希望微调算法。本章概述了常见问题及其解决方案，以及调试策略和性能调优技巧，帮助您解决问题并优化使用体验。

6.1 常见问题与解决方案

以下是一些常见问题及其解决方法：

(1) 安装或导入错误：

症状：运行 import evox 时报错。
解决方案：
- 检查安装：运行 pip show evox 进行验证。如果未安装，请检查您的虚拟环境并重新安装。
- 缺少依赖：如果看到 ModuleNotFoundError: No module named 'torch'，请按照第 2 章所述安装 PyTorch。
- CUDA 不匹配：确保您的 PyTorch 版本与安装的 CUDA 驱动程序匹配。

(2) 未使用 GPU：

症状：EvoX 在 CPU 而非 GPU 上运行。
解决方案：
- 使用 torch.cuda.is_available() 检查。如果为 False，请重新安装兼容 GPU 的 PyTorch 并检查 CUDA 安装。
- 如果为 True 但 EvoX 仍使用 CPU，请确保您的张量已移动到 GPU（有关配置请参阅第 3 章）。

(3) 内存/显存不足 (OOM)：

(4) 收敛停滞：

症状：算法陷入局部最优。
解决方案：
- 增加种群多样性（例如，提高变异率）。
- 尝试不同的算法或参数。
- 确保目标函数定义明确（不要太嘈杂或太平坦）。
- 运行多次试验并选取最佳结果——EvoX 使并行运行变得容易。

(5) 优化结果不佳：

(6) 后端冲突 (JAX vs PyTorch)：

症状：在使用 PyTorch 示例时意外安装了 JAX 版本的 EvoX。
解决方案：默认的 pip install evox 提供的是 PyTorch 版本。如果您安装了 JAX 版本，请按照 PyTorch 说明重新安装（见第 2 章）。JAX 功能有单独的文档说明。

(7) 版本不匹配：

症状：API 调用与安装的版本不匹配。
解决方案：
- EvoX 更新可能会更改方法名称（例如 ask/tell → step）。
- 使用最新的稳定版本并参考其文档。
- 调整代码以适配您的 EvoX 版本，或考虑升级。

由于进化算法的随机性，调试可能比较棘手。以下是一些实用技巧：

(1) 使用小规模测试：

(2) 插入打印语句：

(3) 使用 IDE 断点：

(4) 对自定义组件进行单元测试：

(5) 性能分析 (Profiling)：

(6) 将输出记录到文件：

总的来说，调试 EvoX 项目需要平衡正确性检查和结果分析。首先专注于确保算法正常运行，然后再优化其有效性。

这些技巧有助于您从 EvoX 中挖掘更快的速度和更高的质量：

(1) 渐进式扩展：

(2) 监控硬件使用情况：

(3) 调整并行度：

(4) 利用批量评估：

(5) 减少 Python 开销：

(6) 调整算法选择：

性能调优是迭代的。只要有耐心，您可以将运行时间从数小时缩短到数分钟。EvoX 提供了许多“旋钮”——明智地使用它们来平衡速度和解的质量。