Deduplicación de datos
La deduplicación de datos es una tecnología que elimina copias duplicadas de los mismos datos, reduciendo por esa razón el espacio de almacenamiento. En una organización, puede haber diversos motivos para duplicar datos como un archivo adjunto de correo electrónico específico enviado a varios usuarios. Cuando se realiza la copia de seguridad de estos datos, se acaban guardando varias copias de los mismos datos en los medios de almacenamiento de la copia de seguridad.
La deduplicación de datos elimina los datos redundantes y guarda solamente una instancia de los datos. Todas las otras instancias se reemplazan por una referencia a esa instancia. Este método puede reducir considerablemente el espacio de almacenamiento que se requiere para almacenar datos de la copia de seguridad.
Por ejemplo, puede haber un mismo archivo de 10 MB que 100 usuarios diferentes han almacenado en sus sistemas locales. Cuando se realiza la copia de seguridad de todos estos sistemas o nodos locales, se necesitarían 1000 MB de espacio de almacenamiento. Con la deduplicación de datos, se puede reducir el espacio de almacenamiento a aproximadamente 10 MB porque solamente se almacenará una instancia del archivo en el disco. Las 99 instancias restantes hacen referencia a esa instancia.
Beneficios de la deduplicación de datos
- Almacena más datos de la copia de seguridad en un espacio de almacenamiento.
- Reduce la cantidad de datos que se envían por la red.
- Realiza una copia de seguridad rápida ya que se almacena la información de referencia en vez de los datos reales.
- Reduce el coste del ancho de banda de la red y de los medios de almacenamiento.