您現(xiàn)在的位置:首頁 >關(guān)于我們 >行業(yè)新聞 >數(shù)據(jù)中心服務(wù)器修復(fù):從小時變成分鐘

數(shù)據(jù)中心服務(wù)器修復(fù):從小時變成分鐘

時間:2014年9月18日

  數(shù)據(jù)中心服務(wù)器從來不會停止工作太久,除非發(fā)生故障。供應(yīng)商正在設(shè)計可以更快的修復(fù)、升級和預(yù)防性維護(hù)的服務(wù)器,但是你的IT 員工可以做一些不同的事情。

  解決系統(tǒng)硬件問題并不容易,使用多種策略改進(jìn)系統(tǒng)修復(fù)的響應(yīng)性和效率。

  集合資源

  考慮到不同工作負(fù)載的需求,與服務(wù)供應(yīng)商制定不間斷維護(hù)協(xié)議。例如,一個關(guān)鍵任務(wù)服務(wù)器需要一個60分鐘或者是更快響應(yīng)窗口的服務(wù)合同,一年不間斷運行(24/7/365)。次要的系統(tǒng)只需要兩小時或者是四小時的窗口服務(wù)。服務(wù)合同是昂貴的,所以應(yīng)有根據(jù)的選擇覆蓋范圍。

  當(dāng)內(nèi)部IT員工需要執(zhí)行服務(wù)時、實施明確的指令鏈和逐步升級模式,能夠使監(jiān)測和報表工具立即為合適的團(tuán)隊成員發(fā)送警報。服務(wù)器修復(fù)的最慢方案是向管理程序發(fā)送信息,然后等待人工授權(quán)。保持警報系統(tǒng)及時了解員工的變化。

  這個方案的目標(biāo)是將每一個問題一經(jīng)發(fā)現(xiàn)就解決。服務(wù)票務(wù)系統(tǒng),適合大型數(shù)據(jù)中心,集成了例行服務(wù)請求的緊急報告。這個票務(wù)過程優(yōu)先考慮并簡化IT員工工作流。有效地幫助解決任務(wù)。

  倉庫訓(xùn)練

  庫存清單上的零件都很昂貴且容易產(chǎn)生問題,所以使用零件追蹤系統(tǒng)或者其他庫存控制系統(tǒng)來跟蹤備用零件或者組件升級。使用變更管理系統(tǒng)集成庫存資產(chǎn),所以服務(wù)器升級時可以有記錄、有基準(zhǔn)。這保存了應(yīng)用和內(nèi)部服務(wù)級別協(xié)議(SLA)的用途。許多的服務(wù)臺系統(tǒng)和故障報告表系統(tǒng)都包含存貨清單特性。

  系統(tǒng)文件是第一個丟失的東西,丟失文件嚴(yán)重地阻礙了適時修復(fù)。管理員需要維護(hù)所有系統(tǒng)文件和原始軟件安裝媒介,或者至少保存主機電子文件的一列網(wǎng)址、驅(qū)動或者是軟件升級等等。當(dāng)問題發(fā)生的幾分鐘后,這些舉措可以節(jié)省時間。

  對于老式服務(wù)器來說備用零件極其難找——而且極其昂貴,即使一臺服務(wù)器能夠在折舊之后持續(xù)充分地支持工作負(fù)載,修復(fù)也是問題重重。

  服務(wù)器改變推進(jìn)硬件修復(fù)。服務(wù)器設(shè)計成可合并特性,如同組織精密的鐵軌,一旦服務(wù)器從機架中突出出來,技術(shù)人員可立即將服務(wù)器轉(zhuǎn)移到下面。可以輕松打開服務(wù)器外圍,允許方便地訪問服務(wù)器組件,包括塑料空氣導(dǎo)風(fēng)裝置、風(fēng)扇和擴展卡支架,最小化工具需求。

  最好的修復(fù)是你可以避免修復(fù)。在面臨錯誤時,服務(wù)器的回彈特性總是保持可能崩潰的老版本系統(tǒng)運行。然而回彈特性不能夠預(yù)防問題。它們通常能夠預(yù)防甚至是修改一個錯誤的災(zāi)難性結(jié)果。

  最早版本的回彈特性是雙備份電源供應(yīng)。許多企業(yè)級服務(wù)器提供這個選擇。兩個模塊化電源運行,當(dāng)一個失效時,另一個電源供應(yīng)服務(wù)器直到已經(jīng)失效的模塊被更換。更換可以通過‘熱備份’完成,不需要關(guān)閉系統(tǒng),而是通過虛擬化來實時遷移工作負(fù)載。但是出于對電源利用率的考慮,雙備份電源在今天已經(jīng)失去了吸引力。

  服務(wù)器內(nèi)存恢復(fù)依賴于錯誤校驗碼和內(nèi)存熱備份。當(dāng)工作存儲器模塊提示錯誤,可以通過空閑模塊重建內(nèi)容,直到失效的工作內(nèi)存空間內(nèi)容被更換(通常叫做‘熱交換’)。另一個選擇是保留主要工作內(nèi)存空間的副本。

  CPU可靠性同樣加極大地得到改進(jìn)。像Intel安騰處理器,可以從數(shù)據(jù)總線錯誤中恢復(fù),當(dāng)其他的致命錯誤發(fā)生時,可以重置服務(wù)器。最新的CPU支持步伐一致模式,多處理器比較程序信息,以確保計算操作的集成性。

  服務(wù)器同樣使用很少依賴?yán)鋮s的低電源組件。 除了服務(wù)器本身,虛擬化特性如實時遷移方法,保證了即使硬件失效也不會停止計算工作負(fù)載。群集和備份虛擬機意味著數(shù)據(jù)中心可以托管關(guān)鍵工作負(fù)載的多個副本,以避開硬件停機時間。虛擬工作負(fù)載使硬件定期維護(hù)進(jìn)度變得容易,因為工作負(fù)載可以使用其他機器上的現(xiàn)有資源。

  當(dāng)你在外部供應(yīng)商方處托管工作負(fù)載時,維護(hù)就變成了供應(yīng)商的責(zé)任。這些外包供應(yīng)商在問題發(fā)生時通常隨意考慮或者“盡最大努力”修復(fù)窗口。這可能導(dǎo)致組織機構(gòu)在沒有SLA重要資源的情況下延長停機時間。這就是為什么許多IT廠商選擇在內(nèi)部保留關(guān)鍵工作負(fù)載主要的原因,他們需要控制環(huán)境方面的練習(xí)。

   本文出自海騰數(shù)據(jù)http://m.365qv.cn提供。網(wǎng)站關(guān)鍵詞:服務(wù)器租用服務(wù)器托管,vps主機,虛擬主機,云主機,云服務(wù)器


Copyright© 2004-2020 河南海騰電子技術(shù)有限公司 版權(quán)所有   經(jīng)營性ICP/ISP證 備案號:B1-20180452   豫公網(wǎng)安備 41019702002018號    電子營業(yè)執(zhí)照