jueves, 10 de junio de 2021

¿Por qué invertir en la verificación y validación del proceso y los datos de las copias de seguridad?

En este artículo quiero hablar de una nueva herramienta de software y de su finalidad para la validación de copias de seguridad (Backup Software). Muchos profesionales que no han experimentado una pérdida total de datos asumen que el almacenamiento digital es perfecto y que los dispositivos digitales siempre funcionan a la perfección; sin embargo, la realidad es muy diferente. El almacenamiento es cada vez más denso y un disco duro contiene más información que nunca. Al mismo tiempo, la tasa de error no está bajando drásticamente, por lo que la probabilidad de un fallo por dispositivo ha aumentado en los últimos años. Además, otras amenazas de pérdida de datos se han vuelto más comunes. El ransomware, el malware y el vandalismo provocado por empleados descontentos, por ejemplo, son causas externas de pérdida de datos, mientras que la putrefacción de bits, los defectos del disco y los defectos de la RAM afectan al propio dispositivo.
Otra tendencia de los últimos años es utilizar esquemas de copia de seguridad incremental para acelerar el proceso de copia de seguridad. Por desgracia, lo que muchos profesionales no saben es que las copias de seguridad incrementales introducen una dependencia de la copia de seguridad anterior. Si cualquier copia de seguridad de la cadena de copias de seguridad se corrompe, por la razón que sea, toda la cadena o al menos partes de la cadena de copias de seguridad se vuelven ilegibles. La verdadera razón por la que el esquema incremental se hizo popular es que, a pesar de los avances en el volumen de almacenamiento, los fabricantes de discos duros no pudieron aumentar las velocidades de rendimiento al mismo ritmo, utilizando la misma tecnología. El almacenamiento en SSD tiene una tasa de rendimiento mucho mayor, pero desgraciadamente también una tasa de error mucho más alta, así como un desgaste mucho más rápido. Las celdas de las unidades SSD se desgastan rápidamente y se sustituyen por celdas de repuesto dentro de la propia unidad de forma automática. Sin embargo, el proceso de detección de "célula que pronto fallará" suele aplazarse hasta que la célula se lee realmente, lo que no suele ocurrir con frecuencia en las unidades de copia de seguridad (Backup validation).

Verificación de copias de seguridad
La herramienta anterior ofrece opciones de copia de seguridad para verificar los archivos de copia de seguridad inmediatamente después de su finalización. Estas funciones evitan el sistema de caché de Windows para garantizar que el archivo de datos se está leyendo realmente desde el disco en el que se almacenó. Una característica única de la herramienta anterior es su capacidad para hacer lo mismo con el almacenamiento remoto. Los datos se descargan de nuevo para garantizar que cada archivo se ha procesado correctamente. Existen opciones adicionales para limitar este paso a los archivos de un tamaño determinado.

Validación de copias de seguridad
Las funciones exclusivas de validación de copias de seguridad de la herramienta anterior permiten a los usuarios validar los archivos mucho después de haberlos procesado. Considere el siguiente escenario: un servidor de archivos típico de una pequeña empresa contiene varios terabytes de archivos y carpetas, normalmente unos 10 millones de archivos o más. Lo normal es que menos del 1% de estos archivos se modifiquen con el paso del tiempo, especialmente después de un mes más o menos de la edición final. Por término medio, estos archivos permanecerán en reposo durante años sin que se acceda a ellos. La putrefacción de bits, los defectos de disco, el malware y las simples eliminaciones o alteraciones de archivos causadas por un empleado descontento pueden pasar desapercibidas hasta años después, cuando los discos del servidor de archivos fallan por completo y es necesario realizar una restauración completa. ¿Cómo se puede validar eficazmente un conjunto de datos tan grande?
El software mencionado ofrece una solución única para este problema, en el que se realizan copias de seguridad de terabytes de datos a diario. El software utiliza una función de validación que permite una validación aleatoria de un porcentaje de archivos de copia de seguridad en cada ciclo de copia de seguridad. Por ejemplo, puede configurar el software para que sólo valide el 1% de todos los archivos de copia de seguridad de su servidor de archivos. Si su servidor de archivos tiene actualmente 1 millón de archivos, serían 10.000 archivos a validar. Al validar una selección aleatoria del 1% de todos los archivos de copia de seguridad, se necesitarían 100 ciclos de media para validar cada archivo. Si la copia de seguridad se ejecuta 10 veces al día, se necesitarían 10 días para validar todo el conjunto de copias de seguridad.
Mientras que los conjuntos de copias de seguridad pequeños pueden copiarse y validarse en su totalidad en cuestión de horas, cuando se trata de millones de carpetas y decenas de terabytes de almacenamiento, ya no es posible validar todo el conjunto en cada ciclo de copia de seguridad, debido a las limitadas velocidades de transmisión de datos de la conexión de red y de los discos duros mecánicos. Como solución de compromiso, las funciones de la herramienta cubren todo el dispositivo de copia de seguridad seleccionando un subconjunto aleatorio en cada ciclo de copia de seguridad.
La relectura de los archivos de la copia de seguridad es fundamental porque refresca todas las celdas y sectores de la unidad. Al utilizar la herramienta de validación de copias de seguridad, los datos serán "actualizados" por la unidad, lo que significa que la unidad se ve obligada a volver a comprobar el sector y a realizar las reparaciones internas necesarias. Si las reparaciones ya no son posibles, la unidad enviará una señal a Windows y la herramienta registrará el problema y enviará alertas para informarle del mismo. Además, el software utiliza sumas de comprobación y/o realiza una comparación 1:1 con el archivo original para validar el contenido de cada copia de seguridad. Por lo tanto, la validación de las copias de seguridad es un "seguro" fundamental: tienes una prueba repetida de que todos los archivos de tu almacenamiento de copias de seguridad siguen siendo válidos y legibles.