データデデュプリケーションの動作

Arcserve UDP デデュプリケーション処理では、データはデータブロックに分割されます。各ブロックには、ハッシュと呼ばれる一意の識別子が割り当てられます。ハッシュはボリュームクラスタに基づいて計算されます。デフォルトのデデュプリケーションブロックサイズは、4 KB です（デフォルトのボリュームクラスタサイズは大半のノードで 4 KB です）。これらのハッシュ値は既存のバックアップデータのハッシュ値と比較されます。重複した参照が見つかった場合、これらのデータブロックはバックアップされません。一意の参照を持ったデータブロックのみがバックアップされます。

以下の図に、Arcserve UDP でデデュプリケーションがどのように動作するかを示します。

CA UDP Deduplication の動作の仕組み

バックアップがトリガされると、エージェント上のデデュプリケーションプロセスはまずデータをブロックに分割し、一意のハッシュキーまたは値を各ブロックへ割り当てます。ハッシュ値は次に、復旧ポイントサーバに送信されます。復旧ポイントサーバでは、これらのハッシュ値が既存のハッシュ値と比較され、重複したハッシュはフィルタされます。次に、比較結果はエージェントに送信して戻されます。この重複したハッシュの情報に基づいて、エージェントはバックアップ対象の一意のデータブロックを復旧ポイントサーバに送信します。これらのデータブロックの新しいハッシュ値も、復旧ポイントサーバ上の既存のハッシュリストに挿入されます。

複数のエージェントがある場合でも、デデュプリケーション処理は同様です。ただし、複数のエージェントからの重複データはフィルタされます。これにより、複数のエージェントからのデータの重複も除去できます。

Arcserve UDP でデータデデュプリケーションを使用する利点を以下に示します。

より高速なフルバックアップ
より高速なマージジョブ
グローバルデデュプリケーションのサポート
最適化されたレプリケーション

データ デデュプリケーションの動作

データデデュプリケーションの動作