海量存儲機群系統(tǒng)中提高系統(tǒng)MTTF的設(shè)計和分析
從圖上可以很明顯地看到三個特點。第一,在相同節(jié)點數(shù)目下,備份數(shù)越多,系統(tǒng)的MTTF越大,這是所預(yù)期的。第二,當(dāng)節(jié)點數(shù)目達到1000的時候,在2個備份的情況下,系統(tǒng)MTTF小于1小時;在3個備份的情況下,系統(tǒng)MTTF仍能保持在400小時(約為16天)左右。這些值與前面的理論分析基本一致,數(shù)值都在相同的數(shù)量級。第三,當(dāng)備份數(shù)只有1或2個的時候,隨著節(jié)點數(shù)的增加,系統(tǒng)MTTF顯著下降;而當(dāng)備份數(shù)是3個的時候,隨著節(jié)點數(shù)的增加,系統(tǒng)MTTF基本保持不變。這個現(xiàn)象可以解釋如下。首先,當(dāng)備份數(shù)只有1或2個的時候,系統(tǒng)MTTF隨著節(jié)點數(shù)的增加而下降的原因是:當(dāng)節(jié)點數(shù)增多時,系統(tǒng)中出現(xiàn)節(jié)點失效的可能性就增大。比如,對于一個包含1000個節(jié)點的機群系統(tǒng),若每個節(jié)點的失效速率為l,則系統(tǒng)中出現(xiàn)節(jié)點失效的速率為1000l。在這樣高的失效速率下,很容易發(fā)生包含同一個狀態(tài)塊備份的兩個節(jié)點(當(dāng)備份數(shù)為2時)幾乎同時失效。另外,隨節(jié)點數(shù)的增多,狀態(tài)塊的數(shù)目也成倍增加,這也增加了系統(tǒng)中出現(xiàn)某狀態(tài)塊丟失的可能性。其次,當(dāng)備份數(shù)有3個的時候,系統(tǒng)MTTF隨著節(jié)點數(shù)的增加能保持穩(wěn)定的原因是:當(dāng)節(jié)點數(shù)增多時,雖然系統(tǒng)中出現(xiàn)某個節(jié)點失效的可能性增大,會降低系統(tǒng)MTTF,但另一個能起到相反的作用因素顯著表現(xiàn)出來。這個因素就是通過并發(fā)拷貝操作,大大降低對象狀態(tài)轉(zhuǎn)移時間。舉個例子。假設(shè)一個機群系統(tǒng)有1000個節(jié)點,每個節(jié)點存儲著100個狀態(tài)塊,每個狀態(tài)塊大小為64M。當(dāng)一個節(jié)點失效后,系統(tǒng)就會為其上的100個狀態(tài)塊尋找一對源節(jié)點和目標(biāo)節(jié)點進行轉(zhuǎn)移。正常情況下,在100Mb/s的網(wǎng)絡(luò)里,若只使用一半帶寬的話,轉(zhuǎn)移一個狀態(tài)塊需要(64MB*8b/B*2)/(100Mb/s),即,近似為10秒。那么,轉(zhuǎn)移100個狀態(tài)塊需要1000秒左右,即,近似為15分鐘,這是很長的一段時間。但考慮到系統(tǒng)中有1000個節(jié)點,很容易找到這樣100對源節(jié)點和目標(biāo)節(jié)點,它們沒有任何兩個節(jié)點是相同的。在這種情況下,拷貝操作完全可以并發(fā)進行,100個狀態(tài)塊可在10秒內(nèi)拷貝完畢,這是很短的一段時間。
縮短拷貝時間的最大好處是,在拷貝期間發(fā)生新節(jié)點失效的可能性減小,進而這樣就可以減小某個狀態(tài)塊丟失的可能性。為了證明降低拷貝時間的作用,考慮如下對比實驗。對于備份數(shù)為2和3的那兩組實驗,將原先的tratio的限制舍棄不用,而限制系統(tǒng)中正在進行拷貝的節(jié)點數(shù)目的上限為10個。如果實驗的結(jié)果表明,隨節(jié)點數(shù)的增加,系統(tǒng)MTTF顯著降低,那么就證明了降低拷貝時間對提高系統(tǒng)MTTF的作用。圖3顯示的是得到的實驗結(jié)果。作為對比,把沒有該限制的原實驗結(jié)果也畫在圖上,用虛線表示。實驗的結(jié)果正如所預(yù)料的,在兩種實驗情況下,系統(tǒng)MTTF都隨節(jié)點數(shù)增加,而顯著降低。特別地,當(dāng)節(jié)點數(shù)為1000時,在備份數(shù)為2的情況下,系統(tǒng)MTTF遠低于1小時;在備份數(shù)為3的情況下,系統(tǒng)MTTF只有2小時左右。這些性能數(shù)據(jù),都比原先沒有該限制的實驗,要低得多。
圖3有并發(fā)限制與無并發(fā)限制的比較
5 結(jié)論
本文提出了一個新的動態(tài)備份策略,并行數(shù)據(jù)備份策略。研究表明,該策略可顯著地提高系統(tǒng)的MTTF。特別地,當(dāng)系統(tǒng)節(jié)點數(shù)目達到1000的時候,在3個備份的情況下,系統(tǒng)MTTF仍能保持在幾十天的數(shù)量級。并且指出該策略的有效性主要來源于通過并發(fā)拷貝操作,大大降低了對象狀態(tài)的轉(zhuǎn)移時間。
本文創(chuàng)新點
本文提出了一個新的動態(tài)備份策略,并行數(shù)據(jù)備份策略。通過詳細的理論分析和仿真實驗,指出該策略可以在系統(tǒng)中當(dāng)節(jié)點數(shù)達到成百上千時顯著地提高系統(tǒng)的MTTF。該策略若使用在海量存儲系統(tǒng)中,可以顯著地提高數(shù)據(jù)的可靠性。
評論