數(shù)據(jù)中心服務(wù)最重要的方面之一是正常運(yùn)行時間。現(xiàn)代世界的一切都依賴于連接性。大多數(shù)現(xiàn)代企業(yè)都以一種或另一種形式使用數(shù)據(jù)中心來存儲其所有數(shù)字信息。隨時提供這些信息對所有企業(yè)都至關(guān)重要。據(jù) Gartner 稱,IT 停機(jī)的平均成本為每分鐘 5,600 美元。對于某些企業(yè)來說,每小時的成本可能在 140,000 到 300,000 美元之間。在頻譜的高端,它甚至可能每小時花費(fèi)高達(dá) 540,000 美元。這就是為什么數(shù)據(jù)中心正常運(yùn)行時間對于許多(如果不是全部)企業(yè)來說如此重要的話題。
什么是數(shù)據(jù)中心正常運(yùn)行時間?
一旦您開始深入研究各種數(shù)據(jù)中心提供商,這個術(shù)語可能會令人困惑甚至誤導(dǎo)。但簡單來說,正常運(yùn)行時間是通過數(shù)據(jù)中心可靠穩(wěn)定地為其基礎(chǔ)設(shè)施中托管的所有服務(wù)器提供電力和連接的能力來衡量的。
大多數(shù)現(xiàn)代數(shù)據(jù)中心都具有極高的可靠性。大多數(shù)數(shù)據(jù)中心都有大量冗余和備份系統(tǒng)來保護(hù)系統(tǒng)。如果出現(xiàn)諸如電網(wǎng)中斷、自然災(zāi)害或設(shè)備故障之類的事情,備用系統(tǒng)將在那里以防萬一。由于大多數(shù)現(xiàn)代企業(yè)都依賴數(shù)據(jù)中心,因此這些數(shù)據(jù)中心運(yùn)營幾乎可以應(yīng)對任何事情。即使像電力線中斷這樣的事情也不會阻止數(shù)據(jù)中心在短時間內(nèi)恢復(fù)在線。
數(shù)據(jù)中心的物理基礎(chǔ)設(shè)施很重要,但它并不是影響正常運(yùn)行時間和停機(jī)時間的唯一因素。停機(jī)時間并不總是由硬件故障、自然災(zāi)害或斷電造成的。有時,這些問題可能是軟件問題、配置問題或人為錯誤造成的。但即使出現(xiàn)停機(jī)時間,良好的數(shù)據(jù)中心也可以在訓(xùn)練有素的 IT 經(jīng)理和連接解決方??案的幫助下快速解決這些問題。在數(shù)據(jù)中心層標(biāo)準(zhǔn)方面,所有四個層的正常運(yùn)行時間保證都超過 99%。
Uptime Institute 的數(shù)據(jù)中心層標(biāo)準(zhǔn)系統(tǒng)
數(shù)據(jù)中心使用Uptime Institute Tier 標(biāo)準(zhǔn)系統(tǒng)來顯示他們可以保證客戶的正常運(yùn)行時間以及其他質(zhì)量保證。等級標(biāo)準(zhǔn)系統(tǒng)中有四個不同的等級。
一級數(shù)據(jù)中心通常由小型企業(yè)使用。這些數(shù)據(jù)中心的正常運(yùn)行時間為 99.671%。1 級數(shù)據(jù)中心無法保證冗余,客戶通常預(yù)計每年會有大約 28.8 小時的停機(jī)時間。同樣,數(shù)據(jù)中心是許多企業(yè)的重要組成部分,這就是為什么最低層已經(jīng)提供超過 99% 的正常運(yùn)行時間,每年的停機(jī)時間少于 30 小時。
第 2 層數(shù)據(jù)中心比第 1 層高出一步。這些數(shù)據(jù)中心可以保證 99.749% 的正常運(yùn)行時間。第 2 層數(shù)據(jù)中心還可以為電源和冷卻系統(tǒng)提供部分冗余。保證 2 級數(shù)據(jù)中心客戶每年僅經(jīng)歷 22 小時(或更短)的停機(jī)時間。這一層非常適合需要更多正常運(yùn)行時間和部分冗余保證的中小型企業(yè)。
第 3 層數(shù)據(jù)中心比前一個數(shù)據(jù)中心高出一步,通常由大型企業(yè)使用。第 3 層數(shù)據(jù)中心可以保證至少 99.982 的正常運(yùn)行時間。這些數(shù)據(jù)中心還可以保證每年 1.6 小時(或更少)的停機(jī)時間。因此,對于我們每年的 8,760 小時,Tier 3 數(shù)據(jù)中心客戶可以期望他們的服務(wù)每年只有 1.6 小時可用。
第 4 層數(shù)據(jù)中心位居榜首。這些數(shù)據(jù)中心通常由企業(yè)公司使用。第 4 層數(shù)據(jù)中心可以保證 99.995% 的正常運(yùn)行時間。他們擁有 2N+1 完全冗余的基礎(chǔ)架構(gòu),這是第 3 層數(shù)據(jù)中心的主要區(qū)別。第 4 層數(shù)據(jù)中心還需要 96 小時的斷電保護(hù),以及每年 26.3 分鐘的停機(jī)時間。
影響數(shù)據(jù)中心正常運(yùn)行時間的因素有哪些?
可能導(dǎo)致數(shù)據(jù)中心停機(jī)的幾個方面。所有四層的每個數(shù)據(jù)中心都可能遇到這些問題。第一個是系統(tǒng)故障。使用較舊或不穩(wěn)定的 IT 基礎(chǔ)設(shè)施時可能會出現(xiàn)潛在問題,包括跟上高速傳輸速度和跟上正常運(yùn)行時間保證。定期維護(hù)和升級到新設(shè)備可以防止其中一些問題。
人為錯誤是所有數(shù)據(jù)中心都必須處理的另一個方面。盡管一些數(shù)據(jù)中心已經(jīng)部署了某種人工智能,但所有數(shù)據(jù)中心運(yùn)營仍然有人類數(shù)據(jù),中心經(jīng)理。數(shù)據(jù)中心需要很多。這些系統(tǒng)全天候 24/7 進(jìn)行維護(hù)、測試、維修和監(jiān)控。數(shù)據(jù)中心經(jīng)理并不完美,但數(shù)據(jù)中心使用的最先進(jìn)技術(shù)也有助于解決其中一些問題。
數(shù)據(jù)中心的正常運(yùn)行時間也可能受到自然災(zāi)害的影響。這是另一個不可避免的方面。只是有些事情是我們無法控制的,包括地震、颶風(fēng)、洪水、雷暴和暴風(fēng)雪。所有這些都可能對數(shù)據(jù)中心的正常運(yùn)行時間產(chǎn)生負(fù)面影響。防止自然災(zāi)害造成過多停機(jī)的最佳方法之一是制定良好的災(zāi)難恢復(fù)計劃。一個好的災(zāi)難恢復(fù)計劃還可以幫助解決數(shù)據(jù)丟失問題。
結(jié)論
許多不同的方面可能會導(dǎo)致一些停機(jī)時間,但即使有這些不同的方面,許多數(shù)據(jù)中心仍然可以提供超過 99% 的正常運(yùn)行時間。大多數(shù)數(shù)據(jù)中心聲稱 100% 的正常運(yùn)行時間,但仔細(xì)觀察細(xì)則,這通常不會考慮任何日常維護(hù)或“計劃停機(jī)”。數(shù)據(jù)中心正常運(yùn)行時間標(biāo)準(zhǔn)顯示了現(xiàn)代數(shù)據(jù)中心的可靠性。所有數(shù)據(jù)中心層的正常運(yùn)行時間超過 99% 是非常了不起的。了解數(shù)據(jù)中心正常運(yùn)行時間標(biāo)準(zhǔn)的工作原理很重要,但這并不是在搜索數(shù)據(jù)中心時要考慮的唯一因素。如果您正在尋找數(shù)據(jù)中心提供商,要尋找的最重要的事情之一是可以與您和您的業(yè)務(wù)一起成長的提供商。與您的數(shù)據(jù)中心提供商建立良好的關(guān)系至關(guān)重要,因為畢竟,“一切都是為了連接”。