Argomento precedente: Utilizzo della deduplicazioneArgomento successivo: Come pianificare un'installazione di deduplicazione


Funzionamento della deduplicazione dei dati

La deduplicazione dei dati è una tecnologia che consente di inserire più backup sullo stesso supporto fisico, conservare i backup per periodi di tempi prolungati e accelerare il recupero dei dati. La deduplicazione analizza i flussi di dati inviati per il backup e ricerca le porzioni duplicate, salvando su disco solo quelle singole. La traccia dei duplicati è contenuta in file di indice speciali.

In CA ARCserve Backup, la deduplicazione è un processo in linea che si verifica sul server di backup, nel corso di un'unica sessione. Per identificare la ridondanza tra i processi di backup eseguiti sulle directory principali su due diversi computer, utilizzare la deduplicazione globale.

Durante il primo backup:

Nel diagramma illustrato di seguito, lo spazio su disco necessario per eseguire il backup di questo flusso di dati è inferiore in un processo di backup di deduplicazione rispetto a un normale processo di backup.

Illustrazione: la deduplicazione consente di salvare su disco solo blocchi di dati univoci

Con la deduplicazione, vengono creati tre file per ogni sessione di backup:

Insieme, i due file di indice consumano una piccola percentuale dell'archivio dati totale, pertanto la dimensione dell'unità sulla quale vengono archiviati tali file è meno rilevante rispetto alla sua velocità. È, quindi, opportuno valutare la possibilità di usare un disco compatto o una periferica simile che offra tempi di ricerca rapidi.

Durante i backup successivi:

Nota: utilizzare l'ottimizzazione per migliorare le velocità effettive e ridurre l'utilizzo della CPU. Quando l'ottimizzazione è attivata, CA ARCserve Backup analizza gli attributi dei file, alla ricerca di modifiche apportate al livello dell'intestazione del file. Se non è stata apportata alcuna modifica, l'algoritmo di hash non viene eseguito su tali file e questi non vengono copiati sul disco. L'algoritmo di hash viene eseguito solo sui file modificati a partire dall'ultimo backup. Per attivare l'ottimizzazione, selezionare l'opzione Consenti ottimizzazione backup deduplicazione nella schermata Configura gruppi di deduplicazione. L'ottimizzazione è supportata solo su volumi Windows e non è supportata per backup basati su flussi, quali i backup a livello di SQL VDI, database di Exchange, Oracle o VMware Image.

Quando si rende necessario ripristinare i dati deduplicati, CA ARCserve Backup fa riferimento ai file di indice per prima identificare e poi rilevare ogni blocco di dati necessario a riassemblare il flusso di dati originale.