Linux 发行版与 GPU 驱动
选择 Linux 发行版
许多人认为”老旧且稳定”的 Linux 发行版是服务器的最佳选择。然而,这并不总是正确的——尤其是对于 GPU 服务器。
GPU 服务器的稳定性通常取决于内核版本和 GPU 驱动。由于 GPU 硬件发展迅速,较新的内核和驱动往往更加完善、稳定,并且与最新的 GPU 兼容性更好。它们通常包含更多的错误修复和对最新硬件的更好支持。此外,最新内核和驱动中的 JIT 编译和优化也明显优于旧版本。
例如,虽然 Ubuntu 20.04 被认为是”稳定”版本,但对于 GPU 工作负载来说已经相当过时了。即使是 NVIDIA RTX 3090(并不算特别新的 GPU),也是在 2020 年发布的。这意味着 Ubuntu 20.04 提供的默认驱动可能无法完全支持 3090,可能导致兼容性问题。
在大多数情况下,选择较新的 Linux 发行版(例如 Ubuntu 25.04 比 22.04 提供更好的支持)。
另一个需要考虑的重要因素是 Linux 发行版对非开源(专有)软件的支持程度。一些发行版(如 Fedora)优先考虑开源软件,默认可能不包含专有驱动——例如 NVIDIA 驱动。这可能需要额外的步骤来安装和配置 GPU 驱动。其他发行版(如 Arch Linux、Debian、Ubuntu 和 NixOS)则更加灵活,在需要时更容易安装专有驱动。
安装 GPU 驱动
通常建议安装 Linux 发行版提供的 GPU 驱动。这些驱动通常经过充分测试并与内核良好集成。
警告: 除非你对 GPU 驱动和 Linux 内核非常有经验,否则应避免直接从 NVIDIA 网站安装驱动,因为这可能导致兼容性问题或需要额外的配置。