上一個主題: 刪除重複資料的類型下一個主題: 應使用刪除重複的時機


重複資料刪除的運作方式

Arcserve UDP 刪除重複程序會將資料分割為多個資料區塊,各個區塊都會被指派稱為雜湊的唯一識別碼。 雜湊是按照磁碟區叢集計算而得的。 預設刪除重複區塊大小是 4KB (大部份節點的預設磁碟區叢集大小是 4KB)。 這些雜湊值將與既有備份資料的雜湊值比較,如果找到重複的參考,則不會備份這些資料區塊。 只會備份具備唯一參考的資料區塊。

下圖說明如何在 Arcserve UDP 中進行刪除重複。

CA 刪除重複資料的運作方式

觸發備份時,代理程式的刪除重複程序會先將資料分割為多個區塊,並且將唯一雜湊金鑰或值指派給各個區塊。 雜湊值接著將傳送到復原點伺服器。 在復原點伺服器,這些雜湊值會與現有雜湊值比較,並過濾掉重複的雜湊。 然後將比較結果傳送回代理程式。 根據這項重複雜湊資訊,代理程式會將資料區塊傳送到復原點伺服器進行備份。 這些資料區塊的新雜湊值也會插入到復原點伺服器上的現有雜湊清單。

有多個代理程式時,刪除重複程序將維持不變,不過,將會過濾掉多個代理程式的重複資料。 這甚至可消除來自多個代理程式的任何重複資料。

以下是在 Arcserve UDP 中使用刪除重複資料的優勢