6. トラブルシューティングと最適化

EvoXを使用する際に、問題に遭遇したり、アルゴリズムを微調整したい場合があります。この章では、一般的な問題とその解決策、デバッグ戦略、パフォーマンスチューニングのヒントを概説し、問題の解決と体験の最適化を支援します。

6.1 よくある問題と解決策

以下は、よく遭遇する問題とその対処方法です：

(1) インストールまたはインポートエラー:

症状: import evox実行時にエラーが発生する。
解決策:
- インストールの確認: pip show evoxを実行して確認します。インストールされていない場合は、仮想環境を確認して再インストールしてください。
- 依存関係の不足: ModuleNotFoundError: No module named 'torch'が表示される場合は、第2章の説明に従ってPyTorchをインストールしてください。
- CUDAの不一致: PyTorchのバージョンがインストールされているCUDAドライバーと一致していることを確認してください。

(2) GPUが使用されていない:

症状: EvoXがGPUではなくCPUで実行されている。
解決策:
- torch.cuda.is_available()で確認します。Falseの場合、GPU対応のPyTorchを再インストールし、CUDAのインストールを確認してください。
- TrueでもEvoXがCPUを使用している場合は、テンソルがGPUに移動されていることを確認してください（設定については第3章を参照）。

(3) メモリ不足（RAM/VRAM）:

症状: OutOfMemoryErrorが表示される。
解決策:
- 集団サイズ、問題の次元、または評価頻度を減らします。
- float16（半精度）またはバッチ評価の分割を使用します。
- PyTorchのデバッグ/決定論的モードをオフにします。
- 完全なパレートフロントの代わりに統計のみを保存します（多目的の場合）。
- ハードウェアのアップグレードがメモリボトルネックの究極の解決策です。

(4) 収束の停滞:

症状: アルゴリズムが局所最適に陥る。
解決策:
- 集団の多様性を増やします（例：突然変異率を高くする）。
- 異なるアルゴリズムやパラメータを試します。
- 目的関数が適切に定義されていることを確認します（ノイズが多すぎたり平坦すぎたりしないこと）。
- 複数の試行を実行して最良のものを選択します。EvoXは並列実行を容易にします。

(5) 最適化結果が悪い:

症状: 最終結果が期待を下回る。
解決策:
- 問題定義の確認: 適応度が正しく計算されていることを確認します（例：符号、スケーリング）。
- アルゴリズムの適合性: 他のアルゴリズムを試すか、ハイパーパラメータを調整します。
- 収束曲線の使用:
  - 早期にフラットライン → 早期収束。
  - 振動 → ランダム性が高すぎる。
- アルゴリズムの設定を調整し、時間経過に伴う動作を分析します。

(6) バックエンドの競合（JAX vs PyTorch）:

症状: PyTorchの例を使用しているのに、誤ってJAXバージョンのEvoXをインストールした。
解決策: デフォルトのpip install evoxはPyTorchバージョンを提供します。JAXバージョンをインストールした場合は、PyTorchの手順に従って再インストールしてください（第2章を参照）。JAXの機能は別途ドキュメント化されています。

(7) バージョンの不一致:

症状: API呼び出しがインストールされたバージョンと一致しない。
解決策:
- EvoXの更新によりメソッド名が変更される場合があります（例：ask/tell → step）。
- 最新の安定バージョンを使用し、そのドキュメントを参照してください。
- コードをEvoXのバージョンに合わせて調整するか、アップグレードを検討してください。

6.2 デバッグのヒント

進化アルゴリズムのデバッグは、その確率的な性質のため難しい場合があります。以下は実践的なヒントです：

(1) 小規模テストの使用:

集団サイズと反復回数を減らしてデバッグを簡素化します。
例：pop_size=5、iterations=20。
集団の動作を追跡し、問題を特定しやすくなります。

(2) print文の挿入:

集団の適応度、最良の個体、中間値を表示します。
大きなテンソルの場合は形状を表示するか、小さいものには.tolist()を使用します。
収束とオペレータの効果を理解するのに役立ちます。

(3) IDEブレークポイントの使用:

PyCharmやVS Codeを使用して、アルゴリズムのstep()や評価ロジック内にブレークポイントを設定します。
変数の値、テンソルの内容、状態遷移を検査します。
大きなテンソルには注意してください。クラッシュを避けるために検査対象を制限してください。

(4) カスタムコンポーネントの単体テスト:

交叉/突然変異関数を個別にテストします。
合成入力を使用して、完全な統合前に出力の形状とロジックを検証します。

(5) 実行のプロファイリング:

torch.autograd.profiler.profileやtime.time()を使用してステップのタイミングを測定します。
ボトルネックや無限ループの特定に役立ちます。
遅延が評価にあるのかアルゴリズムロジックにあるのかを特定します。

(6) ファイルへのログ出力:

長時間の実行では.csvファイルにログを書き込みます。
世代ごとの最良適応度、多様性統計などを含めます。
クラッシュによりコンソール出力が見えなくなった場合に便利です。

全体として、EvoXプロジェクトのデバッグには、正確性チェックと結果分析のバランスが必要です。まずアルゴリズムが正しく実行されることを確認し、次にその効果を最適化することに焦点を当ててください。

6.3 パフォーマンスチューニングガイド

これらのヒントは、EvoXからより多くの速度と品質を引き出すのに役立ちます：

(1) 段階的なスケーリング:

小さく始める: 小さな入力でロジックをテストします。
徐々にスケールアップし、実行時間の増加を観察します。
スケーリングが非線形の場合（例：10倍の集団 → 10倍以上の時間）、非効率性を特定します。

(2) ハードウェア使用率の監視:

GPUにはnvidia-smi、CPUにはhtopを使用します。
高いGPU使用率（>50%）が理想的です。
低いGPU使用率は、データがGPU上にないか、頻繁なCPU-GPU転送が速度を低下させている可能性があります。

(3) 並列処理の調整:

CPUスレッドの設定：torch.set_num_threads(n)。
マルチスレッド評価ツールを使用する場合は、オーバーサブスクリプションを避けてください。
GPUの場合、バッチ環境やデータセットを使用する場合はDataLoaderスレッドを最適化します。

(4) バッチ評価の活用:

バッチ評価は個体ごとの評価よりも高速です。
常にProblem.evaluate()をベクトル化して、集団全体を処理するようにしてください。

(5) Pythonオーバーヘッドの削減:

重いロジックをAlgorithmやProblem内に移動し、メインループでの複雑なPythonコードを避けます。
ほとんどの操作にはworkflow.step()を使用します。
実行を遅くする場合は、世代ごとの診断を最小限に抑えます。

(6) アルゴリズム選択の調整:

CMA-ES、GA、PSO、RVEAなどを試してください。すべての問題に最適な単一のアルゴリズムはありません。
より速く収束するアルゴリズムは、収束が遅いアルゴリズムをマイクロ最適化するよりも多くの時間を節約できる場合があります。

パフォーマンスチューニングは反復的なプロセスです。忍耐を持てば、数時間の実行時間を数分に短縮できます。EvoXは多くの「つまみ」を提供しています。速度と解の品質のバランスを取りながら、賢く使用してください。