您現(xiàn)在的位置:首頁 >關(guān)于我們 >行業(yè)新聞 >3大常見的服務(wù)器硬件故障 你是否遭遇過?

3大常見的服務(wù)器硬件故障 你是否遭遇過?

時(shí)間:2010年11月23日

    如今,談及X86服務(wù)器平臺(tái)的CPU,很多人可能對(duì)英特爾和AMD兩大芯片巨頭的產(chǎn)品如數(shù)家珍,從之前的至強(qiáng)5400到主流的至強(qiáng)5600、至強(qiáng)7500,以及AMD強(qiáng)勁的12核心x86處理器“Magny-Cours”等等。同時(shí),服務(wù)器的另外兩個(gè)核心在CPU的基礎(chǔ)上作用不容小視,以帶ECC、ChipKill、熱插拔技術(shù)的內(nèi)存,防止數(shù)據(jù)異常丟失的RAID硬盤等組件共同打造出一個(gè)堅(jiān)若磐石的X86服務(wù)器。

  但由于X86服務(wù)器和臺(tái)式機(jī)有著很多相似之處,無論是從前期部署、中期維護(hù)到后期管理都有著眾多相似之處。因此,X86服務(wù)器盡管有著成熟穩(wěn)定的架構(gòu)體系,也不免出現(xiàn)“罷工”。特別是企業(yè)負(fù)載應(yīng)用得多了,遇到的故障是很平常的事情,以三大組件出現(xiàn)的故障與大家共同分享,可以有效避免大家在以后的業(yè)務(wù)平臺(tái)上出現(xiàn)。   (服務(wù)器租用)

  服務(wù)器核心——CPU

  危害程度:★

  故障回放:做過測試的朋友知道,一臺(tái)基于Intel至強(qiáng)服務(wù)器,開機(jī)無顯示,系統(tǒng)指示燈瘋狂的閃爍,最直接懷疑是CPU與主板的接觸不良,但將其更換到多路服務(wù)器主板的另外一個(gè)CPU插槽之上,依舊沒有反應(yīng)。

  解決方案:在這種狀況下經(jīng)測量,CPU電壓居然出現(xiàn)異常,原來是CPU的VRM(Voltage Regulator Module,電壓調(diào)節(jié)模塊)出現(xiàn)了故障,不能執(zhí)行主板上DC電路轉(zhuǎn)換,無法為CPU提供穩(wěn)定的工作電壓,至此只能更換CPU。

  筆者認(rèn)為這個(gè)故障是比較致命,CPU的損壞將直接導(dǎo)致整個(gè)服務(wù)器的不可用,但是CPU本身的安全性是非常高的,故障率極低。所以在日常維護(hù)任務(wù)中,由于CPU的損壞導(dǎo)致的服務(wù)中斷情況是較為少見,它的危害程度不算太高,如果是多路服務(wù)器更是不用擔(dān)心CPU損壞而帶來的服務(wù)器宕機(jī)了。

  服務(wù)器平臺(tái)的另外兩大核心,莫過于內(nèi)存和硬盤,具體到內(nèi)存的選擇上,服務(wù)器內(nèi)存與普通臺(tái)式機(jī)內(nèi)存還是有一些差異的。仔細(xì)觀察過服務(wù)器內(nèi)存的用戶會(huì)發(fā)現(xiàn),相比普通內(nèi)存單面8顆粒的設(shè)計(jì),服務(wù)器內(nèi)存通常單面有9顆芯片,這就是我們常說的ECC內(nèi)存。

  服務(wù)器讀取性能——內(nèi)存

  危害程度:★★☆

  故障回放:之前在一臺(tái)安裝2條2GB內(nèi)存的服務(wù)器上,由于自身承載的服務(wù)過多,服務(wù)器的處理數(shù)據(jù)的速度越來越慢,于是,通過增加2條同型號(hào)的內(nèi)存條來升級(jí)服務(wù)器。將這些內(nèi)存全部插入主板后,系統(tǒng)檢測只有6GB,另外2GB內(nèi)存神秘消失,反復(fù)的插拔新的內(nèi)存依舊無法正常檢測。

  解決方案:通過服務(wù)器產(chǎn)品官方網(wǎng)站了解,該種情況是因?yàn)樵摲⻊?wù)器的內(nèi)存插槽是配對(duì)使用,1-4、2-5、3-6、7-10、8-11、9-12,新內(nèi)存插在了2、3槽,無法形成配對(duì),自然只能檢測出一條內(nèi)存,將內(nèi)存插到5槽,8GB內(nèi)存順利被檢測。   (服務(wù)器租用)

  可見,服務(wù)器內(nèi)存的優(yōu)勢不僅僅體現(xiàn)在性能上,在容錯(cuò)能力同樣投入很多精力,目的是為整個(gè)平臺(tái)提供高穩(wěn)定環(huán)境,之前提到的內(nèi)存采用的ECC(錯(cuò)誤檢查和糾正)技術(shù)、Register、Chipkill都是為了提高內(nèi)存的穩(wěn)定性,使各個(gè)內(nèi)存條和插槽之間能更好的融合。

如今,談及X86服務(wù)器平臺(tái)的CPU,很多人可能對(duì)英特爾和AMD兩大芯片巨頭的產(chǎn)品如數(shù)家珍,從之前的至強(qiáng)5400到主流的至強(qiáng)5600、至強(qiáng)7500,以及AMD強(qiáng)勁的12核心x86處理器“Magny-Cours”(馬尼庫爾)等等。同時(shí),服務(wù)器的另外兩個(gè)核心在CPU的基礎(chǔ)上作用不容小視,以帶ECC、ChipKill、熱插拔技術(shù)的內(nèi)存,防止數(shù)據(jù)異常丟失的RAID硬盤等組件共同打造出一個(gè)堅(jiān)若磐石的X86服務(wù)器。

  但由于X86服務(wù)器和臺(tái)式機(jī)有著很多相似之處,無論是從前期部署、中期維護(hù)到后期管理都有著眾多相似之處。因此,X86服務(wù)器盡管有著成熟穩(wěn)定的架構(gòu)體系,也不免出現(xiàn)“罷工”。特別是企業(yè)負(fù)載應(yīng)用得多了,遇到的故障是很平常的事情,以三大組件出現(xiàn)的故障與大家共同分享,可以有效避免大家在以后的業(yè)務(wù)平臺(tái)上出現(xiàn)。

  服務(wù)器核心——CPU

  危害程度:★

  故障回放:做過測試的朋友知道,一臺(tái)基于Intel至強(qiáng)服務(wù)器,開機(jī)無顯示,系統(tǒng)指示燈瘋狂的閃爍,最直接懷疑是CPU與主板的接觸不良,但將其更換到多路服務(wù)器主板的另外一個(gè)CPU插槽之上,依舊沒有反應(yīng)。

  解決方案:在這種狀況下經(jīng)測量,CPU電壓居然出現(xiàn)異常,原來是CPU的VRM(Voltage Regulator Module,電壓調(diào)節(jié)模塊)出現(xiàn)了故障,不能執(zhí)行主板上DC電路轉(zhuǎn)換,無法為CPU提供穩(wěn)定的工作電壓,至此只能更換CPU。

  筆者認(rèn)為這個(gè)故障是比較致命,CPU的損壞將直接導(dǎo)致整個(gè)服務(wù)器的不可用,但是CPU本身的安全性是非常高的,故障率極低。所以在日常維護(hù)任務(wù)中,由于CPU的損壞導(dǎo)致的服務(wù)中斷情況是較為少見,它的危害程度不算太高,如果是多路服務(wù)器更是不用擔(dān)心CPU損壞而帶來的服務(wù)器宕機(jī)了。

  服務(wù)器平臺(tái)的另外兩大核心,莫過于內(nèi)存和硬盤,具體到內(nèi)存的選擇上,服務(wù)器內(nèi)存與普通臺(tái)式機(jī)內(nèi)存還是有一些差異的。仔細(xì)觀察過服務(wù)器內(nèi)存的用戶會(huì)發(fā)現(xiàn),相比普通內(nèi)存單面8顆粒的設(shè)計(jì),服務(wù)器內(nèi)存通常單面有9顆芯片,這就是我們常說的ECC內(nèi)存。

  服務(wù)器讀取性能——內(nèi)存

  危害程度:★★☆

  故障回放:之前在一臺(tái)安裝2條2GB內(nèi)存的服務(wù)器上,由于自身承載的服務(wù)過多,服務(wù)器的處理數(shù)據(jù)的速度越來越慢,于是,通過增加2條同型號(hào)的內(nèi)存條來升級(jí)服務(wù)器。將這些內(nèi)存全部插入主板后,系統(tǒng)檢測只有6GB,另外2GB內(nèi)存神秘消失,反復(fù)的插拔新的內(nèi)存依舊無法正常檢測。

  解決方案:通過服務(wù)器產(chǎn)品官方網(wǎng)站了解,該種情況是因?yàn)樵摲⻊?wù)器的內(nèi)存插槽是配對(duì)使用,1-4、2-5、3-6、7-10、8-11、9-12,新內(nèi)存插在了2、3槽,無法形成配對(duì),自然只能檢測出一條內(nèi)存,將內(nèi)存插到5槽,8GB內(nèi)存順利被檢測。  (服務(wù)器租用)

  可見,服務(wù)器內(nèi)存的優(yōu)勢不僅僅體現(xiàn)在性能上,在容錯(cuò)能力同樣投入很多精力,目的是為整個(gè)平臺(tái)提供高穩(wěn)定環(huán)境,之前提到的內(nèi)存采用的ECC(錯(cuò)誤檢查和糾正)技術(shù)、Register、Chipkill都是為了提高內(nèi)存的穩(wěn)定性,使各個(gè)內(nèi)存條和插槽之間能更好的融合。

Copyright© 2004-2020 河南海騰電子技術(shù)有限公司 版權(quán)所有   經(jīng)營性ICP/ISP證 備案號(hào):B1-20180452   豫公網(wǎng)安備 41019702002018號(hào)    電子營業(yè)執(zhí)照