Linux 發行版與 GPU 驅動程式
選擇 Linux 發行版
許多人認為「古老且穩定」的 Linux 發行版是伺服器的最佳選擇。然而,這並不總是正確的——特別是對於 GPU 伺服器而言。
GPU 伺服器的穩定性通常取決於 kernel 版本和 GPU 驅動程式。由於 GPU 硬體發展迅速,較新的 kernel 和驅動程式往往更完善、穩定,並且與近期的 GPU 相容性更好。它們通常包含更多的錯誤修復(bug fixes)以及對最新硬體的更好支援。此外,最新 kernel 和驅動程式中的 JIT 編譯和優化明顯優於舊版本。
例如,雖然 Ubuntu 20.04 被認為是一個「穩定」版本,但對於 GPU 工作負載來說,它現在已經相當過時了。即使是 NVIDIA RTX 3090 這種並不算特別新的 GPU,也是在 2020 年發布的。這意味著 Ubuntu 20.04 提供的預設驅動程式可能無法完全支援 3090,從而可能導致相容性問題。
在大多數情況下,選擇較新的 Linux 發行版(例如 Ubuntu 25.04 提供的支援優於 22.04)是更好的選擇。
另一個需要考慮的重要因素是 Linux 發行版對非開源(專有)軟體的支援程度。某些發行版(如 Fedora)優先考慮開源軟體,預設可能不包含專有驅動程式——例如 NVIDIA 驅動程式。這可能需要額外的步驟來安裝和配置 GPU 驅動程式。其他發行版(如 Arch Linux、Debian、Ubuntu 和 NixOS)往往更靈活,在需要時更容易安裝專有驅動程式。
安裝 GPU 驅動程式
通常建議安裝您的 Linux 發行版提供的 GPU 驅動程式。這些驅動程式通常經過充分測試並與 kernel 整合。
警告: 除非您對 GPU 驅動程式和 Linux kernel 非常有經驗,否則應避免直接從 NVIDIA 網站安裝驅動程式,因為這可能會導致相容性問題或需要額外的配置。