Linux 發行版與 GPU 驅動程式
選擇 Linux 發行版
許多人認為「舊而穩定」的 Linux 發行版是伺服器的最佳選擇。然而,這並不總是正確的——尤其是對於 GPU 伺服器。
GPU 伺服器的穩定性通常取決於核心版本和 GPU 驅動程式。由於 GPU 硬體發展迅速,較新的核心和驅動程式往往更加精煉、穩定,且與最新的 GPU 更相容。它們通常包含更多的錯誤修復和對最新硬體的更好支援。此外,最新核心和驅動程式中的 JIT 編譯和最佳化明顯優於舊版本。
例如,雖然 Ubuntu 20.04 被認為是「穩定」版本,但對於 GPU 工作負載來說已經相當過時。即使是 NVIDIA RTX 3090(並非特別新的 GPU)也是在 2020 年發布的。這意味著 Ubuntu 20.04 提供的預設驅動程式可能無法完全支援 3090,可能導致相容性問題。
在大多數情況下,選擇較新的 Linux 發行版(例如 Ubuntu 25.04 比 22.04 提供更好的支援)。
另一個需要考慮的重要因素是 Linux 發行版對非開源(專有)軟體的支援程度。某些發行版(如 Fedora)優先考慮開源軟體,可能預設不包含專有驅動程式——例如 NVIDIA 驅動程式。這可能需要額外的步驟來安裝和配置 GPU 驅動程式。其他發行版(如 Arch Linux、Debian、Ubuntu 和 NixOS)往往更加靈活,在需要時更容易安裝專有驅動程式。
安裝 GPU 驅動程式
通常建議安裝 Linux 發行版提供的 GPU 驅動程式。這些驅動程式通常經過良好測試並與核心整合。
警告: 除非您對 GPU 驅動程式和 Linux 核心非常有經驗,否則應避免直接從 NVIDIA 網站安裝驅動程式,因為它們可能導致相容性問題或需要額外的配置。