如果您正在運(yùn)行 Linux 服務(wù)器并且重視正常運(yùn)行時(shí)間和穩(wěn)定性,那么本服務(wù)器維護(hù)指南將幫助您保持正常運(yùn)行。出于各種原因,最好定期進(jìn)行維護(hù)和檢查。作為系統(tǒng)管理員并發(fā)現(xiàn)本可以很容易地防止導(dǎo)致停機(jī)的問(wèn)題并不有趣。
Linux 服務(wù)器維護(hù)指南
- 檢查磁盤使用情況: 導(dǎo)致停機(jī)和問(wèn)題的最常見(jiàn)的事情之一是文件系統(tǒng)填滿并達(dá)到 100% 的使用率。使用 80% 通常是警告,使用 90% 是關(guān)鍵。為軟件包、數(shù)據(jù)庫(kù)、站點(diǎn)文件、日志等分配足夠的空間非常重要。如果文件系統(tǒng)變得太滿,您將不得不在為時(shí)已晚和服務(wù)之前爭(zhēng)先恐后地尋找要?jiǎng)h除的文件和日志開(kāi)始掛起。要檢查您的文件系統(tǒng)使用情況,您可以使用“df”命令,例如:df -h 將以人類可讀的格式顯示使用情況。
- 檢查 RAID 陣列: 檢查 RAID 陣列的狀態(tài)很重要。如果陣列中缺少成員磁盤,則應(yīng)盡快更換它。根據(jù)您的 RAID 控制器,您可以下載和使用單獨(dú)的實(shí)用程序。例如:Adaptec 控制器將使用 arcconf,而 LSI 控制器可能需要 MegaCLI 或 tw_cli,具體取決于型號(hào)。最好參考制造商的文檔以獲取指南。
- 檢查存儲(chǔ)設(shè)備智能統(tǒng)計(jì)數(shù)據(jù): 密切關(guān)注存儲(chǔ)設(shè)備的智能統(tǒng)計(jì)數(shù)據(jù)可以警告您發(fā)生故障前。重新分配的、當(dāng)前未決或不可糾正的部門通常會(huì)引起關(guān)注。數(shù)字越高,您應(yīng)該越早更換磁盤。通電時(shí)間也可能需要尋找。我們更換了超過(guò) 40,000 通電時(shí)間的驅(qū)動(dòng)器。在 Linux 服務(wù)器上,您可以使用“smartctl”命令運(yùn)行測(cè)試并檢查統(tǒng)計(jì)信息。可以在此處找到有關(guān) smartctl 的更多信息。
- 驗(yàn)證備份是否正常工作: 檢查備份是否正常運(yùn)行是一種很好的做法。您還應(yīng)該經(jīng)常測(cè)試備份的恢復(fù),并驗(yàn)證它們?cè)跍y(cè)試環(huán)境中是否按預(yù)期工作。
- 確保應(yīng)用安全補(bǔ)丁: 修補(bǔ)在您的服務(wù)器上運(yùn)行的軟件中的漏洞是重中之重。最好訂閱您的發(fā)行版安全公告郵件列表,以便在您需要修補(bǔ)時(shí)收到通知。您可以使用操作系統(tǒng)包管理器(例如 yum 或 apt)來(lái)安裝和升級(jí)新包。
- 檢查遠(yuǎn)程管理: 根據(jù)您的服務(wù)器制造商,IPMI、iLO 和 iDRAC 等遠(yuǎn)程管理工具已被證明是有用的。當(dāng)您需要使用它們時(shí),您應(yīng)該為它們做好準(zhǔn)備。當(dāng)無(wú)法通過(guò) SSH 連接到服務(wù)器時(shí),遠(yuǎn)程控制臺(tái)已經(jīng)保存了很多。
- 檢查硬件問(wèn)題:查看 syslog 和 IPMI 事件日志之類的內(nèi)容可以讓您知道何時(shí)出現(xiàn)問(wèn)題。內(nèi)存錯(cuò)誤、過(guò)熱和電源故障是需要快速響應(yīng)的一些示例。根據(jù)損壞的硬件組件,記錄的條目會(huì)有所不同。
- 檢查軟件錯(cuò)誤: 應(yīng)定期監(jiān)控軟件錯(cuò)誤日志和系統(tǒng)日志。軟件有時(shí)會(huì)達(dá)到配置的限制,當(dāng)內(nèi)存不足時(shí)會(huì)激活 OOM 殺手。有時(shí)這可能會(huì)被忽視。根據(jù)您在哪里找到這些日志的軟件和配置的日志文件輸出會(huì)有所不同。但是,大多數(shù)日志都可以在 /var/log 目錄中找到。
- 查看訪問(wèn)權(quán)限: 檢查哪些用戶和個(gè)人應(yīng)有權(quán)訪問(wèn)服務(wù)器并根據(jù)需要修改該訪問(wèn)權(quán)限。可以在這里找到您應(yīng)該查看的文件的一個(gè)很好的概述。
- 使用強(qiáng)密碼: 無(wú)論是隨機(jī)生成還是使用“diceware”方法制作的強(qiáng)密碼都是必須的。不要縮短密碼并使用低熵組合。