データ デデュプリケーションは、1 つの物理メディアに収まるバックアップ量の増加、バックアップの保持期間の延長、データ回復の高速化を実現するテクノロジです。 デデュプリケーションは、バックアップのために送信されるデータ ストリームの解析し、重複する「チャンク」を探します。 重複は、特別なインデックス ファイルで追跡されます。
CA ARCserve Backup では、デデュプリケーションはバックアップ サーバの単一のセッションで実行されるインライン プロセスです。 2 つの異なるコンピュータのルート ディレクトリで実行されたバックアップ ジョブ間の冗長性を識別するには、グローバル デデュプリケーションを使用します。
最初のバックアップでは、以下の操作を実行します。
以下の図では、このデータ ストリームをバックアップするために必要なディスク容量は、通常のバックアップ ジョブよりもデデュプリケーション バックアップのほうが小さくなっています。
デデュプリケーションでは、各バックアップ セッションに対して、以下の 3 つのファイルが作成されます。
2 つのインデックス ファイルは、データ ストア全体のほんの数パーセントを使用するだけなので、これらのファイルを格納するドライブのサイズは、処理速度に比べればそれほど問題ではありません。 処理速度を上げるには、優れたシーク タイムの半導体ディスクまたはそれに類するデバイスを検討してください。
その後のバックアップで、以下の操作を実行します。
注: スループットを高め、CPU 使用率を軽減するためには、最適化を使用します。 最適化を有効にすると、CA ARCserve Backup はファイル属性をスキャンしてファイル ヘッダ レベルの変更を検索します。 変更されていない場合、これらのファイルにハッシュ アルゴリズムは実行されず、ファイルはディスクにコピーされません。 ハッシュ アルゴリズムは、前回のバックアップから変更されているファイルのみに実行されます。 最適化を有効にするには、[デデュプリケーション デバイスの設定]画面の[デデュプリケーション バックアップでの最適化を許可する]オプションをオンにします。 最適化は、Windows ボリュームでのみサポートされます。 SQL VDI、Exchange DB レベル、Oracle、VMware イメージ レベルのバックアップなどのストリーム ベースのバックアップではサポートされません。
デデュプリケーション データをリストアする必要がある場合、CA ARCserve Backup はまずインデックス ファイルを参照し、次に元のデータ ストリームを再構築するために必要な各データ チャンクを探します。
Copyright © 2014 CA.
All rights reserved.
|
|