磁盤陣列技術(shù)原理學(xué)習(xí)
可靠性和可用性
這二個(gè)名詞雖然相互關(guān)連,事實(shí)上卻代表了硬盤故障的二個(gè)不同的方面,可靠性指的是硬盤在給定條件下發(fā)生故障的概率??捎眯灾傅氖怯脖P在某種用途中可能用的時(shí)間。利用這二個(gè)名詞,我們可以看到磁盤陣列是怎樣把我們的硬盤系統(tǒng)可靠性提高到接近百分之百的程度的。
磁盤陣列可以改善硬盤系統(tǒng)的可靠性。因?yàn)槟骋挥脖P中的數(shù)據(jù)可以從其它硬盤的數(shù)據(jù)中重新產(chǎn)生出來(例如RAID 5),所以很少會(huì)有機(jī)會(huì)使整個(gè)硬盤系統(tǒng)失效。硬盤子系統(tǒng)的可靠性因而大大改善了。
圖表9是RAID硬盤子系統(tǒng)與單個(gè)硬盤子系統(tǒng)的可靠性比較:
我們還必須考慮系統(tǒng)的可用性。單一硬盤系統(tǒng)的可用性比沒有數(shù)據(jù)冗余的磁盤陣列要好,而冗余磁盤陣列的可用性比單個(gè)硬盤的好得多。這是因?yàn)槿哂啻疟P陣列允許單個(gè)硬盤出錯(cuò),而繼續(xù)正常工作。此外,一個(gè)硬盤故障后的系統(tǒng)恢復(fù)時(shí)間也大大縮短(與從磁帶恢復(fù)數(shù)據(jù)相比)。最后,因?yàn)榘l(fā)生故障時(shí),硬盤上的數(shù)據(jù)是故障當(dāng)時(shí)的數(shù)據(jù),替后的硬盤也將包含故障時(shí)的數(shù)據(jù)(舉例說,前天晚上的備份數(shù)據(jù))。要得到完全的容錯(cuò)性能,計(jì)算器硬盤子系統(tǒng)的其它部件也必須有冗余例如提供二個(gè)電源,或者配備雙份硬盤控制器。沒有其它部件的冗余,即使有非??煽康挠脖P子系統(tǒng),還是不能完全防止計(jì)算機(jī)系統(tǒng)的失效。
最佳化的容錯(cuò)系統(tǒng)
如先前所述,直接分段的子系統(tǒng)(RAID 0)可以大大提高讀寫速度(相對(duì)單個(gè)硬盤),因?yàn)閿?shù)據(jù)分散在多個(gè)硬盤,硬盤操作可以同時(shí)進(jìn)行。
把二個(gè)直接分段的硬盤子系統(tǒng)組成鏡像,可以有效地構(gòu)成全冗余的快速硬盤子系統(tǒng)。這樣的子系統(tǒng),其硬盤操作甚至比直接分段的硬盤子系統(tǒng)還快,因?yàn)樵撓到y(tǒng)能同時(shí)執(zhí)行二個(gè)讀操作(每個(gè)硬盤一個(gè)讀操作),而寫操作的速度則與非鏡像直接分段子系統(tǒng)幾乎一樣,因?yàn)榘褦?shù)據(jù)同時(shí)寫入二個(gè)硬盤只需花費(fèi)很少的額外開銷。
通過我們前面所述的概念,例如雙工:(雙控制器,雙電源等),可以進(jìn)一步改善有關(guān)冗余方面的問題。雙控制器還使我們得到更高的數(shù)據(jù)傳輸速度,因?yàn)榭刂破鞒蔀樽酉到y(tǒng)性能瓶頸的可能性更小了。
磁盤陣列技術(shù)術(shù)語(yǔ)
硬盤鏡像(Disk Mirroring):硬盤鏡像最簡(jiǎn)單的形式是,一個(gè)主機(jī)控制器帶二個(gè)互為鏡像的硬盤。數(shù)據(jù)同時(shí)寫入二個(gè)硬盤,二個(gè)硬盤上的數(shù)據(jù)完全相同,因此一個(gè)硬盤故障時(shí),另一個(gè)硬盤可提供數(shù)據(jù)。
硬盤數(shù)據(jù)跨盤(Disk Spanning):利用這種技術(shù),幾個(gè)硬盤看上去像是一個(gè)大硬盤;這個(gè)虛擬盤可以把數(shù)據(jù)跨盤存儲(chǔ)在不同的物理盤上,用戶不需關(guān)心哪個(gè)盤上存有他需要的數(shù)據(jù)。
硬盤數(shù)據(jù)分段(Disk Striping):數(shù)據(jù)分散存儲(chǔ)在幾個(gè)盤上。數(shù)據(jù)的第一段放在盤0,第2段放在盤1,……直至達(dá)到硬盤鏈中的最后一個(gè)盤,然后下一個(gè)邏輯段將放在硬盤0,再下一個(gè)邏輯段放在盤1,如此循環(huán)直至完成寫操作。
雙控(Duplexing):這里指的是用二個(gè)控制器來驅(qū)動(dòng)一個(gè)硬盤子系統(tǒng)。一個(gè)控制器發(fā)生故障,另一個(gè)控制器馬上控制硬盤操作。此外,如果編寫恰當(dāng)?shù)目刂破鬈浖?,可?shí)現(xiàn)不同的硬盤驅(qū)動(dòng)器同時(shí)工作。
容錯(cuò)(Fault Tolerant):具有容錯(cuò)功能的機(jī)器有抗故障的能力。例如RAID 1鏡像系統(tǒng)是容錯(cuò)的,鏡像盤中的一個(gè)出故障,硬盤子系統(tǒng)仍能正常工作。
主機(jī)控制器(Host Adapter):這里指的是使主機(jī)和外設(shè)進(jìn)行數(shù)據(jù)交換的控制部件(如SCSI控制器)。
熱修復(fù)(Hot Fix):指用一個(gè)硬盤熱備份來替換發(fā)生的故障的硬盤。要注意故障盤并不是真正地被物理替換了。用作熱備份的盤被加載上故障盤原來的數(shù)據(jù),然后系統(tǒng)恢復(fù)工作。
熱補(bǔ)(Hot Patch):具有硬盤熱備份,可隨時(shí)替換故障盤的系統(tǒng)。
熱備份(Hot Spare):與CPU系統(tǒng)電連接的硬盤,它能替換下系統(tǒng)中的故障盤。與冷備份的區(qū)別是,冷備份盤平時(shí)與機(jī)器不相連接,硬盤故障時(shí)才換下故障盤。
平均數(shù)據(jù)丟失時(shí)間(MTBDL-Mean Time Between Data Loss):發(fā)生數(shù)據(jù)丟失的事件間的平均時(shí)間。
平均無故障工作時(shí)間(MTBF-Mean Time Between Failure或MTIF):設(shè)備平均無故障運(yùn)行時(shí)間。
廉價(jià)冗余磁盤陣列(RAID-Redundant Array of Inexpensive Drives):一種將多個(gè)廉價(jià)硬盤組合成快速,有容錯(cuò)功能的硬盤子系統(tǒng)的技術(shù)。
系統(tǒng)重建(Reconstruction or Rebuild):一個(gè)硬盤發(fā)生故障后,從其它正確的硬盤數(shù)據(jù)和奇偶信息恢復(fù)故障盤數(shù)據(jù)的過程。
恢復(fù)時(shí)間(Reconstruction Time):為故障盤重建數(shù)據(jù)所需要的時(shí)間。
單個(gè)大容量硬盤(SLED-Singe Expensive Drive)。
傳輸速率(Transfer Rate):指在不同條件下存取數(shù)據(jù)的速度。
虛擬盤(Virtual Disk):與虛擬存儲(chǔ)器類似,虛擬盤是一個(gè)概念盤,用戶不必關(guān)心他的數(shù)據(jù)寫在哪個(gè)物理盤上。虛擬盤一般跨越幾個(gè)物理盤,但用戶看到的只是一個(gè)盤。
評(píng)論