RAID內(nèi)存:回寫技術(shù)和熱插拔容量技術(shù)
本內(nèi)容總結(jié)了工作中RAID內(nèi)存的經(jīng)驗(yàn)教訓(xùn)。下面分別介紹了在HP的熱插拔技術(shù)中應(yīng)用到的兩個(gè)小技術(shù),它們就是回寫(Scrubbing)技術(shù)和熱插拔容量(Hot-Plug Capabilities)技術(shù)。
HP熱插拔RAID內(nèi)存提供了一個(gè)回寫硬件方式,它可以確認(rèn)ECC或RAID檢查出來的軟錯(cuò)誤。HP技術(shù)嘗試定位于在讀內(nèi)存時(shí)檢查出來所有軟錯(cuò)誤,方法是把改正后的正確的數(shù)據(jù)寫回內(nèi)存中去。但此方法不適用于硬錯(cuò)誤。
回寫技術(shù)可以阻止軟錯(cuò)誤的累積,避免發(fā)生更嚴(yán)重的錯(cuò)誤。它降低了ECC的工作量,提高了系統(tǒng)的性能。一些傳統(tǒng)的系統(tǒng)采用的是軟件回寫,HP熱插拔RAID內(nèi)存使用硬件完成這個(gè)工作。
HP熱插拔RAID內(nèi)存會(huì)對(duì)錯(cuò)誤生成錯(cuò)誤日志,錯(cuò)誤極限由軟件設(shè)定。當(dāng)記錄的錯(cuò)誤值達(dá)到錯(cuò)誤極限的時(shí)候,軟件會(huì)自動(dòng)做出反應(yīng)。例如,當(dāng)超過錯(cuò)誤極限的時(shí)候故障燈會(huì)自動(dòng)亮,這就是由軟件控制的。
熱插拔容量(Hot-Plug Capabilities)技術(shù)
HP熱插拔RAID內(nèi)存還允許用戶在不關(guān)閉服務(wù)器電源的情況下在線更換、在線擴(kuò)展及在線升級(jí)DIMM,這就是HP的熱插拔容量技術(shù)。
在線更換是指在系統(tǒng)運(yùn)行的情況下更換出現(xiàn)故障的DIMM。HP熱插拔RAID內(nèi)存不需要操作系統(tǒng)的支持,服務(wù)器在購買的時(shí)候就具有支持在線更換的能力。在線擴(kuò)展指用戶在空的插槽上插入DIMM以擴(kuò)展系統(tǒng)容量。在線升級(jí)是指用戶用容量更大的DIMM替代舊的較小容量的DIMM。在線擴(kuò)展和在線升級(jí)都可以使用戶獲得更大的系統(tǒng)內(nèi)存容量。在線擴(kuò)展和在線升級(jí)要求操作系統(tǒng)的支持,系統(tǒng)要認(rèn)出新增的內(nèi)存。
當(dāng)在線內(nèi)存操作完成后,如果工作在熱插拔RAID內(nèi)存模式下,那么系統(tǒng)會(huì)自動(dòng)在所有的內(nèi)存盒中重新放置數(shù)據(jù)(rebuild)。雖然這樣做會(huì)暫時(shí)降低內(nèi)存的工作性能(重新放置4 GB的數(shù)據(jù)花費(fèi)的時(shí)間少于30s),但是只需要花費(fèi)很少的錢就可以提高容錯(cuò)能力,并可避免系統(tǒng)檢修期間帶來的經(jīng)濟(jì)損失。
評(píng)論