重復(fù)數(shù)據(jù)刪除技術(shù)分析及分類
1.3 基于消冗執(zhí)行次序的分類
(1)在線式消冗
在線處理的重復(fù)數(shù)據(jù)刪除是指在數(shù)據(jù)寫入磁盤之前執(zhí)行重復(fù)數(shù)據(jù)刪除。其最大的優(yōu)點(diǎn)是經(jīng)濟(jì)高效,可以降低對存儲容量的需求,并且不需要用于保存還未進(jìn)行重復(fù)數(shù)據(jù)刪除的數(shù)據(jù)集。在線處理的重復(fù)數(shù)據(jù)刪除減少了數(shù)據(jù)量,但同時(shí)也存在一個問題,處理本身會減慢數(shù)據(jù)吞吐速度。正是因?yàn)橹貜?fù)數(shù)據(jù)刪除是在寫入到磁盤之前進(jìn)行的,因此重復(fù)數(shù)據(jù)刪除處理本身就是一個單點(diǎn)故障。
(2)后處理式消冗
后處理的重復(fù)數(shù)據(jù)刪除,也被稱為離線重復(fù)數(shù)據(jù)刪除,是在數(shù)據(jù)寫到磁盤后再執(zhí)行重復(fù)數(shù)據(jù)刪除。數(shù)據(jù)先被寫入到臨時(shí)的磁盤空間,之后再開始重復(fù)數(shù)據(jù)刪除,最后將經(jīng)過重復(fù)數(shù)據(jù)刪除的數(shù)據(jù)拷貝到末端磁盤。由于重復(fù)數(shù)據(jù)刪除是數(shù)據(jù)寫入磁盤后再在單獨(dú)的存儲設(shè)備上執(zhí)行的,因此不會對正常業(yè)務(wù)處理造成影響。管理員可以隨意制訂重復(fù)數(shù)據(jù)刪除的進(jìn)程。通常先將備份數(shù)據(jù)保留在磁盤上再進(jìn)行重復(fù)數(shù)據(jù)刪除,企業(yè)在需要時(shí)可以更快速地訪問最近存儲的文件和數(shù)據(jù)。而后處理方式的最大問題在于它需要額外的磁盤空間來保存全部還未刪除的重復(fù)數(shù)據(jù)集。
1.4 基于實(shí)現(xiàn)層次的分類
(1)基于軟件的重復(fù)數(shù)據(jù)刪除
在軟件層次,重復(fù)數(shù)據(jù)刪除可以有兩種集成方式,即可以將軟件產(chǎn)品安裝在專用的服務(wù)器上實(shí)現(xiàn),也可以將其集成到備份/歸檔軟件中。基于軟件的重復(fù)數(shù)據(jù)刪除的部署成本比較低;但是基于軟件的重復(fù)數(shù)據(jù)刪除在安裝中容易中斷運(yùn)行,維護(hù)也更加困難。
基于軟件的重復(fù)數(shù)據(jù)刪除產(chǎn)品有EMC公司的Avamar軟件產(chǎn)品、Symantec公司的Veritas NetBackup產(chǎn)品以及Sepaton公司的DeltaStor存儲軟件等。
(2)基于硬件的重復(fù)數(shù)據(jù)刪除
基于硬件的重復(fù)數(shù)據(jù)刪除主要由存儲系統(tǒng)自己完成數(shù)據(jù)的刪減,例如:在虛擬磁帶庫系統(tǒng)、備份平臺或者網(wǎng)絡(luò)附加存儲(NAS)等一般目的的存儲系統(tǒng)中融入重復(fù)數(shù)據(jù)刪除機(jī)制,由這些系統(tǒng)自身完成重復(fù)數(shù)據(jù)刪除功能。
基于硬件的重復(fù)數(shù)據(jù)刪除的優(yōu)點(diǎn)是高性能、可擴(kuò)展性和相對無中斷部署,并且重復(fù)數(shù)據(jù)刪除操作對上層的應(yīng)用都是透明的。這種設(shè)備的缺點(diǎn)就是部署成本比較高,要高于基于軟件的重復(fù)數(shù)據(jù)刪除。
目前基于硬件的重復(fù)數(shù)據(jù)刪除系統(tǒng)主要包括VTL和NAS備份產(chǎn)品兩大類,例如:Data Domain公司的DD410系列產(chǎn)品、Diligent Technologies公司的ProtecTier VTL、昆騰公司的DXi3500和DXi5500系列產(chǎn)品、飛康的VTL產(chǎn)品、ExaGrid Systems公司的NAS備份產(chǎn)品以及NetApp的NearStore R200和FAS存儲系統(tǒng)。
評論