數(shù)據(jù)中心自動化有望迅速改變數(shù)據(jù)中心行業(yè)。查看任何數(shù)據(jù)中心行業(yè)出版物、網(wǎng)站或活動,都會有大量內(nèi)容預測數(shù)據(jù)中心自動化將是什么樣子。數(shù)據(jù)中心專業(yè)人士很好奇自動化將如何改變他們的工作和數(shù)據(jù)中心管理。
事實是我們已經(jīng)知道了。前沿的數(shù)據(jù)中心管理人員已經(jīng)在他們的數(shù)據(jù)中心實施集成和自動化,并且取得了令人難以置信的成果。
“作為一個組織,我們正在努力做的是走出數(shù)據(jù)世界,進入信息世界,”芝加哥大學數(shù)據(jù)中心戰(zhàn)略與運營總監(jiān) Raymond Parpart 說。為實現(xiàn)這一目標,該大學正在使數(shù)據(jù)中心基礎設施管理 (DCIM) 軟件成為“數(shù)據(jù)中心的宇宙中心”。
我們的客戶是世界上最具創(chuàng)新精神和經(jīng)驗最豐富的數(shù)據(jù)中心管理者,這就是我們每天從他們那里聽到的故事。
所有的數(shù)據(jù)中心經(jīng)理都在努力節(jié)省時間和金錢,但最好的人已經(jīng)找到了解決方案,而且很快就流行起來。
您不必懷疑和猜測數(shù)據(jù)中心自動化正在如何改變行業(yè)。以下是當今領先的數(shù)據(jù)中心專業(yè)人員如何推動自動化的十個真實示例。遵循數(shù)據(jù)中心自動化最佳實踐,您也可以顯著簡化數(shù)據(jù)中心管理。
什么是數(shù)據(jù)中心自動化?
數(shù)據(jù)中心自動化是在沒有任何人工操作的情況下完成數(shù)據(jù)中心操作的常規(guī)過程的過程。
數(shù)據(jù)中心自動化的好處是什么?
數(shù)據(jù)中心自動化的好處包括:
- 單一事實來源。集成系統(tǒng)打破了信息孤島并提高了數(shù)據(jù)的準確性。
- 改進的工作流程和生產(chǎn)力。在一個系統(tǒng)中輸入的信息會自動推送到另一個系統(tǒng),無需更新多個系統(tǒng)或交叉檢查數(shù)據(jù),從而節(jié)省您的時間。
- 改進職能團隊之間的協(xié)作。集成創(chuàng)建了所有可用數(shù)據(jù)的整體圖景,從而在所有數(shù)據(jù)中心、設施和 IT 團隊之間實現(xiàn)數(shù)據(jù)驅(qū)動的協(xié)作和決策。
- 提高現(xiàn)有資源能力的利用率。以盡可能最有效的方式自動配置資源,以最大限度地發(fā)揮現(xiàn)有足跡的價值并推遲資本支出。
- 保持正常運行時間并滿足服務水平協(xié)議。獲取有關(guān)數(shù)據(jù)中心可能導致停機的條件的自動通知,以便您可以在它們成為真正的問題之前解決它們。
- 消除人為錯誤。自動化手動數(shù)據(jù)輸入并告別數(shù)據(jù)中心中斷的主要原因:人為錯誤。
- 更加關(guān)注戰(zhàn)略項目。自動化例行的、耗時的任務可以讓您的團隊騰出更多時間來處理更高優(yōu)先級的項目。
- 簡化數(shù)據(jù)中心安全管理。您可以輕松維護用戶權(quán)限以確保遵守安全策略。如果一些用戶只需要訪問部分數(shù)據(jù),他們?nèi)匀豢梢钥吹剿麄冃枰南嚓P(guān)數(shù)據(jù)。
什么是頂級數(shù)據(jù)中心自動化工具?
通過集成推動數(shù)據(jù)中心自動化的最常用工具包括:
- DCIM 軟件。DCIM 軟件是完整數(shù)據(jù)中心管理工具包的核心組件。它在單一管理平臺中提供所有數(shù)據(jù)中心資源和容量的整體視圖,以實現(xiàn)實時容量和變更管理,從而優(yōu)化數(shù)據(jù)中心的可用性、利用率和效率。DCIM 軟件用于跟蹤詳細的資產(chǎn)信息和視覺效果,例如確切的站點和機架位置以及 U 形位置、尺寸、重量、電源和網(wǎng)絡連接,以及機架高度可視化。第二代 DCIM 軟件開箱即用,帶有雙向 RESTful Web 服務 API 和通用 CMDB 以及票務連接器,以簡化集成。
- 蜜蜂。API 使不同的應用程序能夠集成和共享數(shù)據(jù)。
- CMDB。ServiceNow等配置管理數(shù)據(jù)庫 (CMDB)存儲有關(guān)組織內(nèi)的硬件、軟件、系統(tǒng)、設施和人員的信息。它可以幫助 IT 專業(yè)人員了解和管理這些資產(chǎn)及其關(guān)系,以便更有效地提供 IT 服務并做出更好的業(yè)務決策。
- 票務系統(tǒng)。Jira等票務系統(tǒng)用于處理和記錄服務請求,例如移動、添加和更改。
- 開發(fā)運營工具。Ansible、Chef、Jenkins和Puppet等 Dev Ops 工具集成了應用程序開發(fā)和 IT 運營。它們?yōu)榻M織提供了對其 IT 流程和系統(tǒng)的更多控制。借助 Dev Ops 工具,可以更快、更高效地管理 IT 基礎架構(gòu),以實現(xiàn)應用程序和工作負載的快速開發(fā)、測試和部署。
誰從數(shù)據(jù)中心自動化中受益?
雖然整個組織都受益于數(shù)據(jù)中心自動化提供的更高效率和生產(chǎn)力,但我們認為獲得最大價值的職位包括:
- 數(shù)據(jù)中心經(jīng)理
- 數(shù)據(jù)中心工程師
- 數(shù)據(jù)中心運營商
- DCIM/工具管理器
- 開發(fā)運營工程師
- 基礎設施架構(gòu)師
- 基礎設施工程師
- 軟件工程師
1.啟用單一事實來源
集成系統(tǒng)可提高數(shù)據(jù)準確性、節(jié)省時間并增強您已有的數(shù)據(jù)。例如,您可能有一個傳統(tǒng)的 IT CMDB,但它只是一個字段數(shù)據(jù)庫。當您將 CMDB 與 DCIM 軟件集成時,您可以獲得額外的詳細資產(chǎn)信息和視覺效果,例如確切的站點和機架位置以及 U 形位置、尺寸、重量、電源和網(wǎng)絡端口連接,以及機架高度可視化,以提供 3D 體驗。
另外,它非常容易做到。許多組織使用 ServiceNow? 作為他們的 CMDB。現(xiàn)代 DCIM 工具將具有經(jīng)過認證的 ServiceNow 應用程序,支持雙向通信以自動創(chuàng)建、更新和刪除兩個系統(tǒng)中的項目。集成可在不到一小時內(nèi)完成設置。
“我們將使用 ServiceNow 集成,以便當我們的運營團隊添加序列號和資產(chǎn)標簽時,它會自動填充 [在我們的 DCIM 中],”全球數(shù)據(jù)中心工程師 Kon Torres 說。“這為我們的團隊節(jié)省了相當大的一步。”
第二代 DCIM 解決方案還將具有通用 CMDB 和工單連接器,可輕松與您的 BMC?、Cherwell?、Jira? 或本地資產(chǎn)和工單信息集成。將您的 CMDB 和票務系統(tǒng)與 DCIM 軟件集成可實現(xiàn)單一事實來源。借助您可以信賴的準確數(shù)據(jù),您可以更好地管理所有數(shù)據(jù)中心資源并做出更明智的決策。您將打破信息孤島,消除多個手動數(shù)據(jù)輸入,并促進所有職能團隊之間的數(shù)據(jù)驅(qū)動協(xié)作。
2.自動化虛擬機管理
大多數(shù)數(shù)據(jù)中心經(jīng)理都知道服務器虛擬化可以降低硬件成本、加快資源配置并降低能源成本。然而,許多人仍然難以管理他們的集群、主機和虛擬機。通過將您的 VMware? 部署與 DCIM 軟件集成,可以自動完成這項工作。
通過集成 DCIM 軟件和 VMware,您可以注冊“事件”,例如正在部署的新集群、主機或 VM。然后,該信息將自動填充到您的 DCIM 中,因此您可以做很多有用的事情,例如映射 VM 正在運行的物理機器。
您還可以將 DCIM 與 VMware Cloud 集成,包括 AWS 上的 vSphere 和跨混合云,以深入了解公共云和私有云以及本地數(shù)據(jù)中心中的虛擬機。例如,您可以使用 DCIM 或 VMware 層次結(jié)構(gòu)按資產(chǎn)名稱、類型或狀態(tài)進行搜索。或者,如果您要關(guān)閉系統(tǒng)以執(zhí)行維護,您可以確切地知道該主機上有哪些虛擬機。
客戶說設置集成只需要“3 或 4 分鐘”。芝加哥大學監(jiān)控和報告工程師 Abe Shaker 說:“你不僅擁有 [VM] 所在位置的邏輯表示,還擁有物理表示。”?“不涉及人為錯誤。它是自動維護的。”
或者,像 Workday 這樣的 IT 組織使用他們自己的 API 客戶端將 VM 數(shù)據(jù)直接推送到他們的 DCIM 軟件中。他們使用 VMware 應用程序跟蹤他們的 VM 數(shù)據(jù),將數(shù)據(jù)打包成 CSV 文件,然后將其推送到 Jenkins。在那里,他們有一個自動化作業(yè)來處理文件并在他們的 DCIM 軟件中創(chuàng)建或更新信息。
3. 自動配置和編排
Workday 是通過自動化數(shù)據(jù)中心操作可以實現(xiàn)的主要示例。他們利用第二代 DCIM 軟件的雙向 RESTful Web 服務 API 來自動化許多事情,包括設備配置和編排。
在他們部署 DCIM 軟件之前,他們有一個自己開發(fā)的工具,他們已經(jīng)開始與其他系統(tǒng)集成。他們馬上了解到,除非他們能夠近乎實時地執(zhí)行此操作,否則他們將遇到數(shù)據(jù)完整性問題,因為他們的資產(chǎn)工具可能會報告在機器配置完成之前不準確的值。這有可能造成運營、合規(guī)性和可信度方面的問題。為了克服這一挑戰(zhàn),Workday 創(chuàng)造了“生成之源”的概念,類似于眾所周知的“真理之源”。
他們意識到他們需要一種方法來跟蹤兩者。解決方案是利用其 DCIM 軟件的自定義字段功能。他們沒有使用獨立的數(shù)據(jù)庫來捕獲這些期望值,而是在 DCIM 軟件中捕獲期望值和報告值的數(shù)據(jù)。然后,他們將這些所需值用作其供應和編排工具的集成點。
“[自動化] 將使我們的配置過程從機柜的安裝、布線和供電開始就實現(xiàn)零接觸,”首席開發(fā)運營工程師托尼·林肯 (Tony Lincoln) 說。“所有這一切都取決于了解您的資產(chǎn)狀態(tài),它們?nèi)ミ^的地方,它們目前的樣子以及它們的去向。利用自定義字段讓我們構(gòu)建一個框架來跟蹤所有這些。”
4.自動化零件管理
部件管理是現(xiàn)代 DCIM 軟件的一個特點。它使您能夠集中管理所有硬盤驅(qū)動器、卡、內(nèi)存模塊、電纜和任何其他組件。甚至是螺絲盒。對于習慣于使用電子表格手動管理數(shù)以千計的零件和備件的數(shù)據(jù)中心經(jīng)理來說,這種能力是游戲規(guī)則的改變者。像 Workday 這樣的客戶已經(jīng)更進一步并完全自動化了。
通過使用部件管理部署 DCIM 軟件并利用該工具的開放式 API 和 ODBC 訪問,Workday 已將其 DCIM 軟件與 Slack、Jira 和其他工具集成,以:
- 獲取每個位置消耗的零件的每日報告
- 如果消耗的零件數(shù)量超過特定閾值,則發(fā)出警報
- 如果特定部分消耗過多,則發(fā)出警報
- 為過時的部件創(chuàng)建棄用報告
“Jenkins 是一個非常好的自動化工具,它有很多插件可以讓我們提供這個功能,”Workday 高級開發(fā)運營工程師 Moshe Haber 說。“我們有一個 Jira 插件、一個 Slack 插件、一個 Git 插件和 API。自動化基于處理數(shù)據(jù)和生成報告或警報的多個作業(yè)。”
5. 利用業(yè)務規(guī)則引擎
業(yè)務規(guī)則是系統(tǒng)管理員可以為所有用戶的利益創(chuàng)建的自動化程序。通過簡化操作,他們提高了生產(chǎn)率、減少了錯誤并節(jié)省了資金。借助現(xiàn)代 DCIM 解決方案,您可以通過易于使用的規(guī)則引擎將業(yè)務規(guī)則應用于數(shù)據(jù)中心運營。規(guī)則引擎根據(jù)用戶可配置的條件創(chuàng)建自動化規(guī)則。例如,如果一個字段被更新,另一個字段會根據(jù)規(guī)則自動更新為特定值。規(guī)則可以應用于任何符合規(guī)則內(nèi)置邏輯和參數(shù)條件的資產(chǎn)。每當創(chuàng)建或更新滿足規(guī)則條件的資產(chǎn)時,都會評估并應用規(guī)則。
示例用例包括:
- 根據(jù)資產(chǎn)位置更新電源 1 和電源 2 的預算瓦特
- 將資產(chǎn)的序列號字段設置為等于資產(chǎn)的名稱
- 根據(jù)資產(chǎn)的位置和功能類型提供數(shù)據(jù)端口注釋
- 自動設置資產(chǎn)的計劃到期日期
6.自動化設備功率預算
數(shù)據(jù)中心經(jīng)理經(jīng)常為準確規(guī)劃和管理其電源容量的復雜性而苦惱。設備功率預算的傳統(tǒng)方法是將服務器銘牌值降低到 60% 左右。這個過程是手動的、估計的、在很大程度上是不準確的,并且經(jīng)常導致空間和金錢的浪費。
領先的數(shù)據(jù)中心專業(yè)人士通過利用具有自動功率預算功能的 DCIM 軟件獲得了巨大的投資回報。Auto Power Budget 根據(jù)設備在運行應用程序的環(huán)境中的實際測量負載,自動為設備的每個品牌和型號實例計算準確的功率預算數(shù)字。預算數(shù)字每周自動更新。您只需設置一次策略,其余的由軟件完成。
Auto Power Budget 為您提供了很多機會,可以在更少的機架中安全地部署更多設備,從而實現(xiàn)高效的數(shù)據(jù)中心運營。試試免費的計算器,看看您可以使用 Auto Power Budget 節(jié)省多少錢。
Comcast 使用 Auto Power Budget 來規(guī)劃最有效和最快速的部署,方法是提前確定資產(chǎn)的確切安裝位置、連接方式、受影響的下游設備以及這些資產(chǎn)將消耗多少電量。閱讀 Comcast 案例研究,了解他們?nèi)绾螌F(xiàn)有資源的利用率提高 40%。eBay 使用了相同的功能。他們能夠?qū)⑿马椖克璧臋C柜數(shù)量減少 33%,僅在一個項目上就節(jié)省了 120,000 美元。
7. 通過電子郵件自動接收預定圖表和報告
來自數(shù)據(jù)的見解對于做出最佳數(shù)據(jù)中心管理決策至關(guān)重要。然而,數(shù)據(jù)中心設備生成的數(shù)據(jù)量巨大且種類繁多,因此很難了解哪些數(shù)據(jù)是重要的、如何分析這些數(shù)據(jù)以及如何從中提取價值。
使用 Excel? 和 Visio? 等傳統(tǒng)管理工具,這既費時又不準確。第二代 DCIM 軟件通過儀表板圖表、報告和可視化分析實現(xiàn)商業(yè)智能和分析的自動化。無需擔心“輸入垃圾,輸出垃圾”,因為您的設備、儀表和傳感器數(shù)據(jù)會自動收集、存儲并以極高的準確性進行趨勢分析。
借助現(xiàn)代 DCIM 解決方案,您無需任何繁瑣的配置工作即可立即訪問 200 多個圖表和報告。
它還可以讓您輕松實現(xiàn)數(shù)據(jù)共享的自動化,從而推動一種數(shù)據(jù)驅(qū)動協(xié)作的文化。
只需選擇您要創(chuàng)建和分發(fā)的預配置或自定義圖表或報告,選擇電子郵件發(fā)送的頻率,然后選擇誰應該接收它們。然后,工作就完成了,您的團隊和利益相關(guān)者將自動無限期地了解最新的數(shù)據(jù)中心 KPI。
Paddy Power Betfair 高級數(shù)據(jù)中心經(jīng)理 Peter Giles 說:“[DCIM 軟件] 通過自動創(chuàng)建報告并在需要時通過電子郵件將其發(fā)送給我的容量管理報告,大大減少了我們創(chuàng)建容量管理報告的工作量”
8. 自動提醒潛在問題
傳統(tǒng)的電力監(jiān)控和環(huán)境監(jiān)控方式是到現(xiàn)場手動讀取和記錄儀表和傳感器測量值。這會浪費時間,并且讓您容易受到不在現(xiàn)場時可能發(fā)生的問題的影響。
借助 DCIM 軟件,可以輕松地為功率計和環(huán)境傳感器的實時測量讀數(shù)設置警告和臨界閾值。然后,通過在違反閾值時自動發(fā)出警報,您將第一個知道數(shù)據(jù)中心中可能導致停機或降低效率的情況。這使您可以在出現(xiàn)嚴重問題之前主動修復問題。
可以在機架負載、入口負載、斷路器負載和三相平衡上設置功率閾值,以幫助確保您不會超出容量限制而使斷路器跳閘。可以根據(jù)溫度和濕度設置環(huán)境閾值,以在熱點形成、設備過冷或條件超出指導范圍時通知您。您還可以將 DCIM 軟件與 Teams 或 Slack 等協(xié)作工具集成,以便將這些警報發(fā)送給您的整個團隊。每個人都可以看到數(shù)據(jù)中心發(fā)生的事情,以改進協(xié)作和響應時間。
Kingfisher 數(shù)據(jù)中心團隊負責人 Neil Cotmore 表示:“我們的一個主要辦公室在最近的一個問題中證明了這一點的價值,該問題在一夜之間導致網(wǎng)絡連接中斷。”?“它在我們的 24x7 運營團隊的健康狀態(tài)頁面上突出顯示。他們還通過電子郵件收到警報,能夠?qū)ζ洳扇⌒袆樱⑶以搯栴}在工作日開始前一夜之間得到解決,因此任何用戶都不會停機第二天到現(xiàn)場。”
9.利用網(wǎng)絡掛鉤
Webhook 是一種服務,允許一個應用程序在特定事件發(fā)生時將數(shù)據(jù)推送到另一個應用程序。鑒于對現(xiàn)代數(shù)據(jù)中心進行全面遠程管理所需的所有不同軟件工具,使用網(wǎng)絡掛鉤來驅(qū)動數(shù)據(jù)共享的價值是巨大的。
具有 webhook 功能的 DCIM 軟件可以自動將有關(guān)移動、添加和更改的信息推送到必須知道資產(chǎn)詳細信息何時發(fā)生更改的外部系統(tǒng)(例如,資產(chǎn)更改審計日志)。可以通過 webhook 立即發(fā)送更改內(nèi)容、更改人員以及更改時間等詳細信息。
因違反電源和環(huán)境閾值而引發(fā)的警報也可以通過 Webhook 發(fā)送到 Teams、Slack 或其他外部系統(tǒng),以便所有團隊成員和利益相關(guān)者了解數(shù)據(jù)中心的當前狀況。可以主動調(diào)查和解決潛在問題,以最大限度地延長正常運行時間和效率。
10. 使用 API 實現(xiàn)任何自動化
借助第二代 DCIM 軟件的雙向 RESTful Web 服務 API,您幾乎可以自動化任何可以通過 GUI 完成的工作。可能性是無止境。
使用 API,您可以創(chuàng)建、讀取、更新和刪除所有項目、端口、位置、查找列表、請求和工作訂單、電源和數(shù)據(jù)連接、自定義字段和模型庫項目。它們?yōu)槟峁┝藙?chuàng)建自動化的自由。
MacStadium 是一家通過 DCIM 軟件和 API 節(jié)省時間并提高工作效率的公司。他們一直致力于改善客戶的在線供應體驗,并希望在滿足或超過 SLA 的同時提供快速履行。
他們已成功將 DCIM 軟件與計費平臺、客戶門戶、管理系統(tǒng)和會計系統(tǒng)集成,以實現(xiàn)后臺處理的自動化。這消除了手動數(shù)據(jù)輸入和人為錯誤的可能性。
MacStadium 會自動分配插槽和計算設備,以便為在其網(wǎng)站上下訂單的客戶按需準備就緒。他們的自動化將設備從預留賬戶直接轉(zhuǎn)移到客戶賬戶,并更新所有內(nèi)部系統(tǒng)以反映變化。
MacStadium 首席基礎設施工程師/架構(gòu)師 Robert Perkins 說:“使用 API,我們能夠輪詢現(xiàn)有機架,查看我們有可用空間的地方,并通過我們的網(wǎng)站自動將該空間分配給客戶訂單。”?“使用 API,我們的團隊可以利用與之前相同的工作流程,但我們獲得了 DCIM 的所有優(yōu)勢,并且能夠遠程查看我們的數(shù)據(jù)中心。”
匯集一切
數(shù)據(jù)中心自動化并不是對數(shù)據(jù)中心未來的模糊預測。它已經(jīng)在這里了。世界上最好的數(shù)據(jù)中心經(jīng)理正在開創(chuàng)令人興奮的新方法,通過自動化手動和例行任務來簡化和優(yōu)化數(shù)據(jù)中心管理。他們數(shù)據(jù)中心自動化戰(zhàn)略的核心是 DCIM 軟件。不要冒險落后。從他們的例子中學習并實施他們的數(shù)據(jù)中心自動化最佳實踐,以推動當今數(shù)據(jù)中心的自動化。