明輝手游網(wǎng):79things.com

本站App下載  |  

首頁 > 電腦資訊 > 電腦知識

消除用戶對重復(fù)數(shù)據(jù)刪除技術(shù)的四大誤區(qū)

作者:佚名   來源:本站   時(shí)間:2018-04-13  點(diǎn)擊:137次

  雖然現(xiàn)在存儲介質(zhì)的價(jià)格直線下滑,單位存儲成本已經(jīng)很低。但是仍然跟不上企業(yè)數(shù)據(jù)文件增長的速度。隨之而來的,能源消耗、數(shù)據(jù)備份管理等等也都成了老大難問題。而且一些重復(fù)的文件也隨著增多了。為此企業(yè)現(xiàn)在迫切需要一門技術(shù),能夠確保在存儲設(shè)備中存儲的是獨(dú)一無二的文件。在這種背景下,重復(fù)數(shù)據(jù)刪除技術(shù)也就應(yīng)運(yùn)而生了。簡單的說,重復(fù)數(shù)據(jù)刪除技術(shù)就是一種減少或者刪除冗余文件、字節(jié)或者數(shù)據(jù)塊的技術(shù)。它的目的很簡單,就是確保存儲的文件不重復(fù),從而減少數(shù)據(jù)容量。不過在實(shí)際工作中,由于種種原因用戶對這個(gè)技術(shù)還存在著一些誤解。消除這些誤區(qū),對于大家正確使用重復(fù)數(shù)據(jù)刪除技術(shù)很關(guān)鍵。

  誤區(qū)一:后期處理重復(fù)數(shù)據(jù)刪除技術(shù)的工作時(shí)機(jī)。

  重復(fù)數(shù)據(jù)刪除技術(shù)根據(jù)其實(shí)現(xiàn)的方式可以分為“聯(lián)機(jī)重復(fù)數(shù)據(jù)刪除技術(shù)”和“后期處理重復(fù)數(shù)據(jù)刪除技術(shù)”。兩個(gè)技術(shù)各有各的特點(diǎn)。不過由于“后期處理重復(fù)數(shù)據(jù)刪除技術(shù)”這個(gè)名字起得有點(diǎn)其一,所以不少用戶對此存在著誤解。如一些人會誤認(rèn)為后期處理重復(fù)數(shù)據(jù)刪除方式是當(dāng)所有數(shù)據(jù)備份過程結(jié)束后才進(jìn)行驗(yàn)證、刪除操作的。如果大家這么認(rèn)為,那么就是大錯(cuò)特錯(cuò)了。

  其實(shí)后期處理重復(fù)數(shù)據(jù)刪除技術(shù)通常是在虛擬的磁帶介質(zhì)寫入備份數(shù)據(jù)后就開始進(jìn)行工作了。也就是說實(shí)在等待虛擬磁帶寫滿之后就開始。當(dāng)然這中間根據(jù)需要有一定的延遲。如存儲管理員可以根據(jù)不同的情況對這個(gè)延遲進(jìn)行設(shè)置?梢灾谎舆t短短的幾分鐘,也可以延遲幾個(gè)小時(shí)。延遲時(shí)間具體為多少,主要還是根據(jù)企業(yè)的實(shí)際情況來選擇。如有些管理員可能會將這個(gè)作業(yè)放在服務(wù)器比較空閑的時(shí)候進(jìn)行,此時(shí)就會把這個(gè)延遲設(shè)置的比較長一點(diǎn),如等到下班后進(jìn)行等等。

  這里需要注意的是一般情況下,為了提高數(shù)據(jù)備份的效率,會對數(shù)據(jù)備份進(jìn)行分組管理。此時(shí)等待時(shí)間是從第一組備份任務(wù)傳送備份數(shù)據(jù)流開始算起。當(dāng)?shù)谝槐P虛擬的備份磁帶寫滿或者第一組備份數(shù)據(jù)寫入結(jié)束后,重復(fù)數(shù)據(jù)刪除處理就不存在延遲等待問題。這主要是因?yàn)楫?dāng)系統(tǒng)在進(jìn)行前一組寫入備份數(shù)據(jù)進(jìn)行重復(fù)數(shù)據(jù)刪除處理時(shí),被分系統(tǒng)可以繼續(xù)往后續(xù)虛擬磁帶介質(zhì)中寫入第二組的備份數(shù)據(jù)。簡單的說,就是重復(fù)數(shù)據(jù)處理作業(yè)與備份數(shù)據(jù)的寫入作業(yè)可以獨(dú)立運(yùn)行。從而提高數(shù)據(jù)處理的效率。

  誤區(qū)二:后期處理重復(fù)數(shù)據(jù)刪除方式會降低整體備份的效率。

  如果光從技術(shù)上看,這個(gè)結(jié)論是成立的。一方面重復(fù)刪除方式會占用服務(wù)器的資源。另一方面,重復(fù)刪除方式存在著一定的延遲。但是這是一個(gè)比較孤立的觀點(diǎn)。因?yàn)楦鶕?jù)現(xiàn)在的重復(fù)數(shù)據(jù)刪除技術(shù),完全可以通過合理的配置來消除這種負(fù)面影響。

  在實(shí)際工作中,如果技術(shù)人員發(fā)現(xiàn)后期處理重復(fù)數(shù)據(jù)刪除技術(shù)降低了數(shù)據(jù)備份的效率,那么可以通過如下幾種方式來消除這個(gè)不利影響。一是可以將重復(fù)數(shù)據(jù)刪除技術(shù)分配到多個(gè)單獨(dú)的服務(wù)器上來分擔(dān)服務(wù)器的壓力。一般情況下在對已寫入的備份數(shù)據(jù)進(jìn)行重復(fù)數(shù)據(jù)刪除時(shí),不同的處理引擎往往會訪問同一磁盤陣列。不過現(xiàn)在的技術(shù)可以使得他們訪問同一磁盤陣列的不同區(qū)域。換句話說,就是可以實(shí)現(xiàn)高速的并發(fā)處理。這樣的話,就不會和持續(xù)寫入的備份數(shù)據(jù)流產(chǎn)生任何的沖突,從而不會影響數(shù)據(jù)備份的效率。二是可以適當(dāng)調(diào)整數(shù)據(jù)延遲的時(shí)間。如可以縮短延遲時(shí)間,或者適當(dāng)延長延遲時(shí)間避開數(shù)據(jù)備份的高峰時(shí)間等等。

  總之,后期處理重復(fù)數(shù)據(jù)刪除技術(shù)在一定程度上確實(shí)會影響到數(shù)據(jù)備份的整體效率。但是通過合理的配置,可以將這個(gè)負(fù)面影響降低到最低的程度。至少與其優(yōu)勢相比,這個(gè)負(fù)面影響是可以忽略不計(jì)的。

  誤區(qū)三:降低備份數(shù)據(jù)流的讀取速度不利于數(shù)據(jù)備份。

  從技術(shù)上說,在同等條件下采取重復(fù)刪除技術(shù),肯定會在一定程度上降低備份數(shù)據(jù)流的讀取速度。但是存儲管理員需要明白一點(diǎn),評價(jià)一個(gè)技術(shù)是否合適,并不能夠只看一個(gè)指標(biāo),而應(yīng)該從總體上去評價(jià)。簡單的說,需要評價(jià)一下總體的備份時(shí)間是否有所縮短?復(fù)雜一點(diǎn),需要判斷備份過程是否能夠滿足備份窗口,或者RTO的需求?在實(shí)際工作中,有些指標(biāo)可能比備份數(shù)據(jù)流的讀取速度更加的重要。如RTO需求就是如此。

  另外值得一提的是,如果采取重復(fù)數(shù)據(jù)刪除技術(shù)的話,一般要求相關(guān)設(shè)備要有比較高的配置或者性能。因?yàn)閺臄?shù)據(jù)備份的任務(wù)來看,其實(shí)包括兩個(gè)部分,分別為數(shù)據(jù)的傳統(tǒng)備份與重復(fù)數(shù)據(jù)刪除作業(yè)。雖然說這兩個(gè)作業(yè)可以獨(dú)立運(yùn)行,但是其運(yùn)行所需要的時(shí)間是不同的。而只有黨重復(fù)數(shù)據(jù)刪除處理結(jié)束之后,整個(gè)備份作業(yè)才算真正完成。故如果后期處理重復(fù)數(shù)據(jù)刪除設(shè)備的性能比較差時(shí),就會降低系統(tǒng)的重復(fù)數(shù)據(jù)刪除比。故筆者在部署這個(gè)項(xiàng)目的時(shí)候,往往會對重復(fù)數(shù)據(jù)刪除設(shè)備進(jìn)行評估與測試,看其性能上是否能夠滿足要求。

  在現(xiàn)實(shí)工作中有很多案例可以說明,雖然采用重復(fù)數(shù)據(jù)刪除技術(shù)后會在一定程度上降低存儲數(shù)據(jù)流的讀取速度,但是卻可縮短整個(gè)備份作業(yè)所花的時(shí)間,能夠滿足RTO的需求。有句俗話說的好,只看結(jié)果不看過程。評價(jià)任何一門技術(shù)都是如此,應(yīng)該從一個(gè)整體上進(jìn)行評價(jià),而不能夠某幾個(gè)個(gè)別的指標(biāo)。否則的話,就可能會引起用戶的誤判。

  誤區(qū)四:重復(fù)數(shù)據(jù)刪除技術(shù)與備份數(shù)據(jù)流寫入作業(yè)無法同時(shí)運(yùn)行。

  如果備份數(shù)據(jù)流在寫入的時(shí)候,只對同一個(gè)磁盤進(jìn)行操作,那么這個(gè)問題確實(shí)存在。但是在現(xiàn)實(shí)工作中,這是根本不存在的。因?yàn)樵趯?shí)際應(yīng)用中,重復(fù)數(shù)據(jù)刪除技術(shù)往往是跟虛擬存儲等結(jié)合使用的。也就是說,一般會將備份數(shù)據(jù)流寫入到多盤虛擬磁帶介質(zhì)中。而實(shí)際寫入磁帶的數(shù)量往往會遠(yuǎn)遠(yuǎn)大于用戶實(shí)際擁有的磁帶驅(qū)動總數(shù)。這說明一個(gè)什么問題呢?也就是說,當(dāng)其他磁帶正在進(jìn)行復(fù)制或者讀寫等操作的時(shí)候,重復(fù)刪除技術(shù)可以在其他磁帶介質(zhì)上進(jìn)行重復(fù)數(shù)據(jù)刪除的作業(yè)。換句話說,就是重復(fù)數(shù)據(jù)刪除作業(yè)與數(shù)據(jù)復(fù)制、寫入等到作可以并發(fā)的運(yùn)行。只是其操作的對象不同而已。兩者可以互不沖突的獨(dú)立運(yùn)行。

  現(xiàn)在筆者比較擔(dān)心的是如果數(shù)據(jù)讀寫作業(yè)要對某個(gè)磁帶驅(qū)動器進(jìn)行操作,而這個(gè)虛擬磁帶庫正好在進(jìn)行重復(fù)數(shù)據(jù)刪除作業(yè),此時(shí)這個(gè)作業(yè)就會停下來。從而產(chǎn)生沖突。憑現(xiàn)在的技術(shù)還很難從根本上解決這個(gè)問題,只可以曲線救國。如將虛擬磁帶庫的容量設(shè)置的小一點(diǎn),讓這個(gè)沖突產(chǎn)生的幾率降低。

  另外據(jù)筆者的了解,已經(jīng)有廠商在往這方面努力。如他們嘗試著通過分割磁帶數(shù)據(jù)區(qū)域的方法來實(shí)現(xiàn)并發(fā)讀寫。如果這個(gè)技術(shù)能夠?qū)崿F(xiàn)的話,那么當(dāng)備份軟件正在對某個(gè)磁帶介質(zhì)進(jìn)行寫入操作的時(shí)候,就可以對這個(gè)介質(zhì)的其他部分進(jìn)行重復(fù)數(shù)據(jù)刪除處理。這個(gè)原理很簡單,就是將某個(gè)磁帶數(shù)據(jù)區(qū)域再進(jìn)行劃分,以實(shí)現(xiàn)不同區(qū)域的并發(fā)處理。

  總之,從總體上來,重復(fù)數(shù)據(jù)刪除技術(shù)的負(fù)面作用是存在的。但是通過合理的配置與管理,可以將其控制在用戶可以接受的范圍之內(nèi)。故用戶需要消除以上這些誤區(qū),可以放心大膽的使用。

推薦游戲

換一換