Previous Topic: デデュプリケーションの使用Next Topic: デデュプリケーション デバイス ファイルのバックアップ


データ デデュプリケーションの動作

データ デデュプリケーションは、1 つの物理メディアに収まるバックアップ量の増加、バックアップの保持期間の延長、データ回復の高速化を実現するテクノロジです。Deduplication analyzes data streams sent to be backed up, looking for duplicate "chunks."It saves only unique chunks to disk.重複は、特別なインデックス ファイルでトラッキングされます。

Arcserve Backup では、デデュプリケーションはバックアップ サーバの単一のセッションで実行されるインライン プロセスです。2 つの異なるコンピュータのルート ディレクトリで実行されたバックアップ ジョブ間の冗長性を識別するには、グローバル デデュプリケーションを使用します。

最初のバックアップでは、以下の操作を実行します。

以下の図では、このデータ ストリームをバックアップするために必要なディスク容量は、通常のバックアップ ジョブよりもデデュプリケーション バックアップのほうが小さくなっています。

Illustration:Deduplication saves only unique data chunks to disk.

デデュプリケーションでは、各バックアップ セッションに対して、以下の 3 つのファイルが作成されます。

2 つのインデックス ファイルは、データ ストア全体のほんの数パーセントを使用するだけなので、これらのファイルを格納するドライブのサイズは、処理速度に比べればそれほど問題ではありません。処理速度を上げるには、優れたシーク タイムの半導体ディスクまたはそれに類するデバイスを検討してください。

その後のバックアップで、以下の操作を実行します。

注:Use Optimization for better throughputs and decreased CPU usage.最適化を有効にすると、Arcserve Backup はファイル属性をスキャンしてファイル ヘッダ レベルの変更を検索します。変更されていない場合、これらのファイルにハッシュ アルゴリズムは実行されず、ファイルはディスクにコピーされません。ハッシュ アルゴリズムは、前回のバックアップから変更されているファイルのみに実行されます。最適化を有効にするには、[デデュプリケーション デバイスの設定]画面の[デデュプリケーション バックアップでの最適化を許可する]オプションをオンにします。最適化は、Windows ボリュームでのみサポートされます。SQL VDI、Exchange DB レベル、Oracle、VMware イメージ レベルのバックアップなどのストリーム ベースのバックアップではサポートされません。

デデュプリケーション データをリストアする必要がある場合、Arcserve Backup はまずインデックス ファイルを参照し、次に元のデータ ストリームを再構築するために必要な各データ チャンクを探します。