因?yàn)槊總€(gè)數(shù)據(jù)中心和IT運(yùn)營都是獨(dú)特的,影響整體運(yùn)行的變量很多。Brynolfsson認(rèn)為,兩個(gè)不同的公司擁有幾乎相同的IT生態(tài)系統(tǒng),但其中一個(gè)公司的生產(chǎn)率可能只有其競爭對手的一小部分。但是,首席技術(shù)官可以遵循幾個(gè)最佳實(shí)踐,以確保其IT操作高效、在能力范圍內(nèi)運(yùn)行并盡可能高效地執(zhí)行。
來源 | 機(jī)房360
編輯 | Harris??
??
? ? ? 行業(yè)專家Erik Brynjolfsson在發(fā)表的一篇文章中指出,“當(dāng)今IT經(jīng)理面臨的關(guān)鍵問題不是‘IT是否有回報(bào)?’,而是‘我們?nèi)绾尾拍茏詈玫厥褂糜?jì)算機(jī)?’”這不是一個(gè)簡單的問題,因?yàn)槊總€(gè)數(shù)據(jù)中心和IT運(yùn)營都是獨(dú)特的,影響整體運(yùn)行的變量很多。Brynolfsson認(rèn)為,兩個(gè)不同的公司擁有幾乎相同的IT生態(tài)系統(tǒng),但其中一個(gè)公司的生產(chǎn)率可能只有其競爭對手的一小部分。但是,首席技術(shù)官可以遵循幾個(gè)最佳實(shí)踐,以確保其IT操作高效、在能力范圍內(nèi)運(yùn)行并盡可能高效地執(zhí)行。
1.清理和銷毀
清潔可以緩解壓力。服務(wù)器和網(wǎng)絡(luò)設(shè)備都有固定的使用壽命,舊設(shè)備應(yīng)該按照制造商規(guī)定的時(shí)間表退役。舊設(shè)備應(yīng)妥善銷毀、回收或退回制造商,并將所有數(shù)據(jù)擦拭干凈,以確保適當(dāng)?shù)陌踩?/p>
2.測量PUE
谷歌是全球最大的云服務(wù)提供商之一,他們運(yùn)營著大量的數(shù)據(jù)中心,其中一些包含數(shù)千臺服務(wù)器。該公司對保持?jǐn)?shù)據(jù)中心在高峰時(shí)期的運(yùn)行有一兩點(diǎn)了解。谷歌公司表示,人們?nèi)绻麩o法管理不能衡量的東西,搜索引擎的領(lǐng)導(dǎo)者通過衡量能源使用來描述其數(shù)據(jù)中心的效率表現(xiàn)。
谷歌公司說:“我們使用能源使用效率(PUE)來幫助我們減少用于非計(jì)算的能源,比如冷卻和配電?!痹摴镜臄?shù)據(jù)中心至少每秒測量一次樣本。另外,還考慮了天氣因素,因?yàn)榧竟?jié)變化對PUE有顯著影響。
3.管理氣流
“良好的氣流管理是數(shù)據(jù)中心高效運(yùn)行的基礎(chǔ)?!惫雀韫局赋?。熱點(diǎn)應(yīng)完全消除,而空白頁或填充面板應(yīng)用于空機(jī)架插槽。這有助于減少灰塵問題。填充板確保氣流不受干擾,灰塵可以很容易地吹走。適當(dāng)?shù)臍饬鲗鋮s至關(guān)重要。
使用正確安裝的填充面板,空氣會吹到它應(yīng)該吹的地方,從而在服務(wù)器運(yùn)行時(shí)保持機(jī)架處于適當(dāng)?shù)臏囟取_@是一個(gè)最小的成本投資最大的性能增強(qiáng)解決方案,非常值得花時(shí)間安裝填充面板。
4.監(jiān)控一切
根據(jù)Plant&Works工程公司的說法,man是“有史以來最好的狀態(tài)監(jiān)測設(shè)備”,但他的地位正受到當(dāng)今眾多監(jiān)測工具的威脅。一個(gè)經(jīng)驗(yàn)豐富的IT技術(shù)人員可能會理解他多年來使用的系統(tǒng)的每一個(gè)細(xì)微差別,但是今天的流程和監(jiān)控工具在理解操作流程方面比人要深入得多。業(yè)務(wù)流程管理(BPM)軟件、機(jī)器人流程自動化(RPA)和AIOps都是從早期的IT操作管理工具演變而來的,旨在通過自動化流程以及潛在的自我修復(fù)系統(tǒng)來增強(qiáng)IT操作。
Gartner將AIOps定義為一個(gè)平臺,利用大數(shù)據(jù)和人工智能增強(qiáng)IT運(yùn)營功能,如監(jiān)控、自動化和服務(wù)臺活動,并具有前瞻性、個(gè)性化和動態(tài)洞察力?!盇IOps平臺支持同時(shí)使用多種數(shù)據(jù)源、數(shù)據(jù)收集方法、分析(實(shí)時(shí)和深層)技術(shù)和表示技術(shù)。AIOps解決方案可以了解和監(jiān)控公司的日常IT操作,分析整個(gè)IT系統(tǒng),然后解決問題或向有能力的人發(fā)出警報(bào)。
5.容量規(guī)劃
容量規(guī)劃是確定組織的系統(tǒng)和運(yùn)營需求的過程,目的是了解和滿足由于銷售和使用公司產(chǎn)品和/或服務(wù)而不斷變化的IT和能源需求。容量管理試圖在高峰使用時(shí)以適當(dāng)?shù)男阅芷胶膺m當(dāng)數(shù)量的用戶,以確保令人愉快的最終用戶體驗(yàn)。IT容量規(guī)劃包括估計(jì)公司的存儲、硬件、軟件和連接基礎(chǔ)設(shè)施所需的資源,以便系統(tǒng)盡可能以最佳方式工作,同時(shí)限制浪費(fèi)的容量。容量管理旨在向物理或虛擬服務(wù)器添加或減少CPU、內(nèi)存和存儲。
首席技術(shù)官應(yīng)該優(yōu)化他們的系統(tǒng),同時(shí)通過將業(yè)務(wù)需求與云服務(wù)利用率關(guān)聯(lián)起來,在應(yīng)用程序級別不斷地檢查他們的云使用情況。首席技術(shù)官應(yīng)通過高級分析計(jì)劃增長并預(yù)測即將到來的成本。通過監(jiān)視一切,首席技術(shù)官將非常了解IT部門的CPU、內(nèi)存、存儲和電源使用情況,并采取相應(yīng)的行動。
6.提高價(jià)值
數(shù)據(jù)中心是當(dāng)今大多數(shù)企業(yè)的業(yè)務(wù)處理中心。增加容量、減少冗余和提高總體效率應(yīng)該是每個(gè)首席技術(shù)官的目標(biāo)。在許多方面,首席技術(shù)官被要求做不可能的事情。大數(shù)據(jù)只會變得越來越大,越來越難以處理。大數(shù)據(jù)的五個(gè)V已經(jīng)擴(kuò)展到七個(gè)—體積、速度、多樣性、可變性、準(zhǔn)確性、可視化和價(jià)值。
以前從來沒有這么多公司有這么多的方法來收集、跟蹤、量化,甚至可視化數(shù)據(jù),但這幾乎是一個(gè)壓倒性的任務(wù)。5G的推出和物聯(lián)網(wǎng)的擴(kuò)展只會讓數(shù)據(jù)收集、集成、虛擬化,甚至可視化變得更加困難。
Brynjolfsson警告說,“在信息經(jīng)濟(jì)中,稀缺的資源不是信息,而是人類處理這些信息的能力。以下的許多最佳實(shí)踐將人類從等式中剔除,這并不是一件壞事,因?yàn)槿藗兊臅r(shí)間通??梢愿玫鼗ㄔ诟邔哟魏蛣?chuàng)造性的努力上,而不是重復(fù)的、令人麻木的工作上。在價(jià)值鏈高度自動化的部分,信息流的速度往往會急劇加快,因此卻在其他地方遇到了僵局,特別是在人們必須參與、流程沒有更新的地方。結(jié)果是整體表現(xiàn)幾乎沒有變化?!?/p>
現(xiàn)在是整理數(shù)據(jù)中心的時(shí)候了,也許這需要更多的自動化和更少的人力。