最大化正常運(yùn)行時(shí)間應(yīng)該是每個(gè)數(shù)據(jù)中心的首要任務(wù),無(wú)論是小型數(shù)據(jù)中心還是超大規(guī)模數(shù)據(jù)中心。為了讓您的數(shù)據(jù)中心持續(xù)運(yùn)行,必須制定冗余系統(tǒng)計(jì)劃。
什么是數(shù)據(jù)中心冗余?
數(shù)據(jù)中心冗余是指一種系統(tǒng)設(shè)計(jì),其中關(guān)鍵組件(例如 UPS 單元、冷卻系統(tǒng)和備用發(fā)電機(jī))被復(fù)制,這樣即使某個(gè)組件發(fā)生故障,數(shù)據(jù)中心也可以繼續(xù)運(yùn)行。例如,冗余UPS 系統(tǒng)在停電時(shí)開(kāi)始工作。如果由于惡劣天氣、停電或組件故障而導(dǎo)致停機(jī),數(shù)據(jù)中心備份組件將發(fā)揮其作用以保持整個(gè)系統(tǒng)的運(yùn)行。
為什么數(shù)據(jù)中心冗余很重要?
企業(yè)必須增加正常運(yùn)行時(shí)間并更快地從停機(jī)中恢復(fù),無(wú)論是意外停機(jī)還是計(jì)劃停機(jī)。停機(jī)會(huì)損害業(yè)務(wù)。它會(huì)對(duì)品牌形象、業(yè)務(wù)運(yùn)營(yíng)和客戶(hù)體驗(yàn)產(chǎn)生嚴(yán)重而直接的影響,導(dǎo)致毀滅性的財(cái)務(wù)損失、錯(cuò)失商機(jī)和聲譽(yù)受損。即使對(duì)于小型企業(yè)而言,計(jì)劃外停機(jī)仍然會(huì)造成每分鐘數(shù)百美元的損失。
數(shù)據(jù)中心的冗余配置有助于降低停機(jī)風(fēng)險(xiǎn),從而減少意外影響造成的損失。從長(zhǎng)遠(yuǎn)來(lái)看,精心規(guī)劃的冗余設(shè)計(jì)意味著更短的潛在停機(jī)時(shí)間。此外,冗余組件還可以確保數(shù)據(jù)安全可靠,因?yàn)閿?shù)據(jù)中心的運(yùn)營(yíng)始終如一,永不失敗。
冗余也是衡量數(shù)據(jù)中心可靠性、性能和可用性的關(guān)鍵因素。Uptime Institute 提供了一個(gè)層級(jí)分類(lèi)系統(tǒng),根據(jù)四個(gè)不同的層級(jí)(第 1 層、第 2 層、第 3 層和第 4 層)對(duì)數(shù)據(jù)中心進(jìn)行認(rèn)證。每個(gè)層級(jí)對(duì)數(shù)據(jù)中心冗余級(jí)別都有嚴(yán)格和具體的要求。
不同級(jí)別的冗余
沒(méi)有一刀切的冗余設(shè)計(jì)。從長(zhǎng)遠(yuǎn)來(lái)看,較低級(jí)別的冗余意味著增加潛在的停機(jī)時(shí)間。雖然更多的冗余將減少停機(jī)時(shí)間,但會(huì)增加維護(hù)冗余組件的成本。但是,如果您的業(yè)務(wù)模型需要盡可能少的停機(jī)時(shí)間,那么就利潤(rùn)和整體凈增長(zhǎng)而言,這通常是合理的。要為您的企業(yè)選擇正確的配置,重要的是要認(rèn)識(shí)到不同冗余模型(包括 N、N+1、N+X、2N、2N+1 和 3N/2)的功能和風(fēng)險(xiǎn)。
N型
N 等于在全 IT 負(fù)載下為設(shè)施供電、備份或冷卻所需的容量。它可以表示您要復(fù)制的單元,例如發(fā)電機(jī)、UPS 或冷卻單元。例如,如果一個(gè)數(shù)據(jù)中心需要三個(gè) UPS 單元以滿負(fù)荷運(yùn)行,則 N 等于三。
N 架構(gòu)意味著該設(shè)施僅設(shè)計(jì)用于保持?jǐn)?shù)據(jù)中心滿負(fù)荷運(yùn)行。簡(jiǎn)單地說(shuō),N 等同于零冗余。如果數(shù)據(jù)中心設(shè)施處于滿負(fù)荷狀態(tài)并且出現(xiàn)硬件故障、計(jì)劃維護(hù)或意外中斷,任務(wù)關(guān)鍵型應(yīng)用程序?qū)⑹艿接绊憽J褂?N 設(shè)計(jì),任何中斷都會(huì)使您的企業(yè)在問(wèn)題解決之前無(wú)法訪問(wèn)您的數(shù)據(jù)。
N+1 或 N+X 模型
N+1 冗余模型通過(guò)向 N 架構(gòu)添加單個(gè)組件(UPS、HVAC 系統(tǒng)或發(fā)電機(jī))來(lái)支持故障并維持完整的工作負(fù)載,從而提供最低級(jí)別的彈性。當(dāng)一個(gè)系統(tǒng)離線時(shí),額外的組件會(huì)接管負(fù)載。回到前面的例子,如果 N 等于三個(gè) UPS 單元,則 N+1 提供四個(gè)。同樣,N+2 冗余設(shè)計(jì)提供了兩個(gè)額外的組件。在我們的示例中,N+2 提供五個(gè) UPS 單元而不是四個(gè)。所以 N+X 提供了 N+X 組件來(lái)降低在多個(gè)同時(shí)發(fā)生故障的情況下的風(fēng)險(xiǎn)。
2N模型
2N 冗余創(chuàng)建原始 UPS、冷卻系統(tǒng)或發(fā)電機(jī)的鏡像,以提供全面的容錯(cuò)能力。這意味著如果需要三個(gè) UPS 單元來(lái)支持全部容量,則此冗余模型將包括一組額外的三個(gè) UPS 單元,總共有六個(gè)系統(tǒng)。該設(shè)計(jì)還利用了兩個(gè)獨(dú)立的分配系統(tǒng)。
使用 2N 模型,數(shù)據(jù)中心運(yùn)營(yíng)商可以在不影響正常運(yùn)營(yíng)的情況下拆除整套組件進(jìn)行維護(hù)。此外,如果出現(xiàn)計(jì)劃外的多個(gè)組件故障,附加組件將接管以維持全部容量。該模型的彈性大大降低了停機(jī)風(fēng)險(xiǎn)。
2N+1模型
如果 2N 意味著完全容錯(cuò),那么 2N+1 提供完全容錯(cuò)的 2N 模型加上額外的組件以提供額外保護(hù)。該模型不僅可以承受多個(gè)組件故障,即使在整個(gè)主系統(tǒng)離線的最壞情況下,它仍然可以維持 N+1 冗余。由于其高度的可靠性,這種冗余模型通常被不能容忍哪怕是輕微的服務(wù)中斷的企業(yè)所使用。
3N/2型號(hào)
三對(duì)二或 3N/2 冗余模型是指一種冗余方法,其中額外容量基于系統(tǒng)負(fù)載。如果我們考慮 3N/2 場(chǎng)景,三個(gè)供電系統(tǒng)將為兩個(gè)服務(wù)器供電,這意味著每個(gè)供電系統(tǒng)使用 67% 的可用容量。同樣,在 4N/3 中,將有四個(gè)供電系統(tǒng)為三個(gè)工作負(fù)載(三臺(tái)服務(wù)器)供電。3N/2 可以升級(jí)到 4N/3,但僅限于理論上。這是因?yàn)檫@樣一個(gè)精心設(shè)計(jì)的模型有太多的組件,很難管理和平衡負(fù)載以保持冗余。
什么是適合你的?
選擇滿足您業(yè)務(wù)需求的冗余模型可能具有挑戰(zhàn)性。在可靠性和成本之間找到適當(dāng)?shù)钠胶恻c(diǎn)是關(guān)鍵。對(duì)于需要盡可能少的停機(jī)時(shí)間的企業(yè),就利潤(rùn)和整體凈增長(zhǎng)而言,更高水平的冗余是合理的。對(duì)于那些不這樣做的人,較低級(jí)別的冗余是可以接受的。它們比其他更復(fù)雜的冗余設(shè)計(jì)更便宜、更節(jié)能。
總之,沒(méi)有正確或錯(cuò)誤的冗余模型,因?yàn)樗Q于一系列因素,例如您的業(yè)務(wù)目標(biāo)、預(yù)算和 IT 環(huán)境。請(qǐng)咨詢(xún)您的數(shù)據(jù)中心提供商或與您的 IT 團(tuán)隊(duì)討論以確定最適合您的選擇。