Copias de Seguridad (BackUp)
Las copias de seguridad son una forma de protección de
datos tal que permiten la recuperación de la información
(ya sean datos o aplicaciones) en el caso de que tenga lugar la pérdida
del equipamiento informático (o hardware), ya sea debido
a desastres naturales, fallos de disco, espionaje, errores de operación
del sistema, etc.
Todos y cada uno de los aspectos relacionados con las copias de seguridad
deben estar claramente especificados en lo que se conoce como Política
de BackUp. Se trata de un documento donde han de figurar, entre otros,
la periodicidad con la que se realizan las copias, el/los métodos
empleados para su realización (absoluto, incremental o combinación
de ambos), los datos de los que se va a realizar copia, los responsables
de realizarlas, ...
De igual importancia que la protección física del
equipamiento es la protección de los medios empleados para realizar
las copias de seguridad. Por ejemplo, la ubicación final de los
dispositivos de backup y alternativamente los medios de almacenamiento
debe realizarse en una zona alejada respecto de la sala de equipamiento
informático. El fin es evitar que una misma catástrofe (como
un incendio) destruya tanto equipos como copias.A su vez, la protección
física de las copias ha de ser acorde con la que se aplica al equipamiento,
dependiendo de la naturaleza de la información que recogen (sensibilidad
de los datos, ...).
Relacionado también con el tema de la seguridad, es el etiquetado
de los medios donde se realizan las copias de seguridad (cintas, CD-ROM,
...). Éste suele hacerse generalmente con excesivo detalle acerca
de su contenido, de modo que el proceso de recuperación de un archivo
determinado es relativamente rápido. A su vez, tanta información
puede suponer una pérdida de confidencialidad de cara a un intruso
que consiga acceso a las copias. Por contra, resulta imprescindible recurrir
a algún método de etiquetado que evite tener que pasar por
todas las copias para obtener la información. Dicho etiquetado deberá,
por tanto, seguir una codificación determinada que únicamente
conozcan los administradores y los encargados de realizar las copias de
seguridad.
Otro detalle muy importante es la comprobación de las copias
realizadas, de modo que se garantice la integridad de los datos almacenados.
Para ello, en lugar de restaurar y comprobar la copia entera se suele optar
por la recuperación de diversos archivos escogidos de modo aleatorio,
asumiendo que la copia es correcta en caso de que no se produzcan errores.
En lo que respecta a los medios de almacenamiento más comunes
podemos encontrar:
-
Discos flexibles
-
Discos Duros
-
Cintas Magnéticas
-
CD-ROM's
Los discos flexibles, en detrimento, no suelen ser la opción
más acertada ya que presentan baja fiabilidad y capacidad de almacenamiento
(si bien su coste es también reducido). Basta con acercarlo a una
fuente de radiación (un electroimán, ...) para que se borre
parte de, o toda, la información contenida.
Los discos duros, ya sea de forma completa o una partición,
presentan mayor fiabilidad y capacidad. Además pueden usarse a través
de un sistema de ficheros, o como un dispositivo secuencial (manejable
con la orden tar). En otras situaciones, si el disco destinado a
backup posee las mismas características que el empleado para el
sistema, se puede recurrir a la orden dd para realizar la copia,
con lo que se obtiene un replicado exacto y funcional del original.
Las cintas magnéticas, continuan siendo en la actualidad
el método más extendido para realizar copias de seguridad.
Basadas originalmente en sistemas para almacenar video (cintas de 8mm),
han ido evolucionando hacia sistemas con una menor tolerancia a la corrupción
de los datos (ya que mientras la pérdida de unos pocos bytes en
un stream de video no supone un problema, sí puede resultar fatal
en el caso de un backup), hasta el standard actual correspondiente a las
cintas DAT de 4mm (DDS 3 y 4). Este tipo de medio ofrece elevadas capacidades
de almacenaje (a partir de 4Gb, correspondiente a las cintas de 90m), que
puede verse incrementado en el caso de que el lector ofrezca compresión
hardware de datos (lo que puede causar cierta dependencia con el fabricante
de la unidad lectora, introduciendo posibles problemas de compatibilidad
con otras lectoras).
La implantación en los ultimos años de grabadoras CD-ROM
tanto en equipos ofimáticos o de escritorio como en estaciones de
trabajo, ha permitido la introducción de un nuevo soporte de backup:
el cdrom. Si bien la capacidad de almacenamiento (700Mb) no puede
compararse con el de las cintas DAT, el reducido coste de los cdroms (normales
o regrabables) compensa en muchas ocasiones su empleo (dependiendo siempre
del volumen de datos). De uso menos extendido, por el momento, debido al
coste tanto de las unidades grabadoras como de los soportes, es el DVD.
Dicho medio es el heredero del CD-ROM, y es de esperar que acabe desplazándolo
con el tiempo.
Existen actualmente mayor número de soportes para la realización
de backups, con prestaciones y precios comprendidos entre los anteriores.
Ejemplos son unidades Iomega (Jazz o Zip), Superdisk, memorias USB, ...
Otro detalle a tener en cuenta a la hora de escoger un soporte de backup,
es el tipo de acceso que se pretende realizar a los datos. Mientras que
discos y cdroms ofrecen un acceso aleatorio (es decir, implementan un sistema
de ficheros), las cintas únicamente permiten el acceso secuencial,
lo que introduce una espera asociada al posicionamiento del cabezal sobre
el punto adecuado de la cinta.
Finalmente, entre las distintas modalidades existentes para realizar
copias de seguridad, puede optarse bien por la realización de una
copia completa de la información (backup de nivel 0), o por guardar
únicamente los archivos modificados desde la última copia
(nivel 1, y sucesivos niveles en función del nivel de referencia).
La copia de nivel cero supone la política básica para
realizar backups, y se caracteriza por su simplicidad (tanto de generación
de las copias como de recuperación); por contra es el método
que más recursos consume (tanto de soporte como de tiempo). En cambio,
las copias de niveles superiores o backups incrementales (o progresivos)
requieren menor duración y capacidad para su realización
(dado que únicamente almacenan aquellos datos que han sido modificados
desde la última copia de referencia), siendo su principal desventaja
la dependencia con los niveles inferiores a la hora de recuperar la totalidad
de los datos. A la vista de los distintos métodos suele ser muy
habitual emplear combinaciones de ambos, de modo que se realicen backups
de nivel cero con cierta periodicidad, entre los que se intercalan varias
copias incrementales (de primer nivel habitualmente). En cualquier caso,
la elección de este tipo de política se ve afectada por la
naturaleza del soporte empleado para relizar la copia de seguridad.
Políticas de BackUp
Una política de backup debe comprender en mayor medida
todos los aspectos de una copia de seguridad, entre los que cabe mencionar:
-
Ámbito de aplicación (tipo de datos que se van a incluir
en el backup). Éste a su vez establece el nivel de protección
que hay que asignar a las copias realizadas (es decir, empleo de criptografía,
confinamiento de los backups, ...). Dicha especificación del tipo
de datos puede influir en los siguientes apartados (en función,
por ejemplo, de si se trata de datos de usuarios, copia del sistema operativo,
copia de apliaciones, ...).
-
Periodicidad de las copias que se van a realizar.
-
Elección del soporte para el backup.
-
Método empleado (absoluto, incremental o combinaciones de ambos).
-
Ubicación final de las copias.
-
Responsables (tanto de realizar las copias como de llevar a cabo la comprobación
de la integridad de los datos almacenados) y responsabilidades.
-
Definiciones pertinentes.
La elección realizada en cada apartado debería asegurar
la optimalidad del sistema de backup escogido.
Caso práctico
-
El sistema del que se pretende realizar copias de seguridad está
formado por una granja de cálculo y diversos puestos de trabajo
(de tipo ofimático y representación gráfica). Todos
ellos pertenencen a una subred privada, obteniendo acceso al exterior a
través de un router con NAT y mejorando de este modo la seguridad
interna.
-
Las copias se van a realizar en tres soportes distintos: Disco duro, Cintas
DAT y CD-ROM. Los dos primeros están situados en un servidor de
backup, mientras que las copias en cdrom se realizarán de modo local
en cada estación de trabajo (todas poseen grabadora de cdrom). El
servidor de backup consta de 6 discos SCSI de 73Gb cada uno y una controladora
RAID en placa. Además tendrá conectada una unidad externa
para cintas DAT con compresión por hardware.
-
Los puestos de trabajo, comparten (previa autenticación del usuario
local o del usuario de copia remoto) el directorio de documentos ubicado
en una partición de 2Gb. En principio dicho directorio no contempla
la presencia de datos sensibles. El backup de éstos (documentos
con datos personales) queda bajo la responsabilidad del usuario del puesto
de trabajo, y se presupone que será realizado en cdrom.
-
De las granjas de cálculo únicamente se realizará
un backup de sistema en caso de instalación o actualización,
y del directorio local donde residan los programas de cálculo (/opt
o /usr/local). La presencia de resultados en las granjas será
obviada y es responsabilidad del usuario hacer copia local en su puesto
de trabajo habitual.
-
En lo que respecta al servidor de backup, las copias (empleando el comando
tar o smbtar) se almacenarán de modo jerárquico
y estructurado en subdirectorios por cada estación de trabajo, distribuyéndolas
en tres de los discos (RAID 5, software). A su vez, estos tres discos serán
replicados en los otros tres (RAID 1, hardware).
-
Existirán dos juegos completos de cintas DAT de modo que sea posible
volcar a cinta el contenido completo de los tres discos en el servidor
de backup, ambos juegos de cintas se irán permutando cíclicamente.
-
La periodicidad con la que se realicen las copias dependerá del
soporte: la copia a disco se hará semanal, automatizándola
para que comience cada sábado a partir de las 22:00. Las copias
en cinta serán quincenales y se realizarán en lunes en horario
de trabajo (a partir de las 9:00) dado que se presume la necesidad de emplear
varias cintas para realizar el backup. En el caso de los datos personales
de las estaciones de trabajo, el tiempo transcurrido entre las copias de
seguridad dependerá de la elección del usuario.
-
Todos los backups serán absolutos.
-
La realización de los backups en cinta será realizada por
cualquiera de los usuarios pertenecientes al grupo, y consistirá
únicamente en ir cambiando las cintas bajo demanda (el inicio del
backup estará programado y se realizará de modo automático).
Si bien, se llevará un registro del usuario responsable de una determianda
copia, fijado con anterioridad con opción a introducir cambios (sustituciones,
...).
-
Las cintas se almacenarán en un despacho separado del laboratorio,
en un armario con llave. Si bien laboratorio y almacén están
en el mismo edificio. El único etiquetado de las cintas corresponderá
con un identificador: I-1/n, ..., I-n/n o II-1/n, ..., II-n/n.
-
El control de la integridad de las copias se realizará a través
del empleo de checksums (md5, ...), escogiendo un procentaje de archivos
aleatorios (cuyo número dependerá de la carga del systema
y del volumen de datos almacenados), y contrastándolos con los originales.
Esto se realizará tanto en las copias en disco, como en cinta, una
vez finalizada la copia. En caso de que se detecten inconsistencias en
los datos, se procederá a repetir de modo automático el backup.
Si se detecta una segunda inconsistencia se ha de reportar el error al
administrador para analizar las causas (fallo de comunicaciones, de soporte,
...).
Se baraja la posibilidad de introducir capas de criptografía tanto
a nivel de cinta (via openssl empleando pipes) como de disco (sistema
de ficheros encriptado tipo tcfs, loopy, cfs, ...), una vez el sistema
esté en correcto funcionamiento.
Bibliografía
La mayor parte de los conceptos se han obtenido del manual "Seguridad
en UNIX y Redes" (v2.1), y de los apuntes tomados en clase de la
propia asignatura (F39, plan 1991). Para la elaboración de las políticas
de backup se ha hecho uso de ejemplos encontrados en internet, procedentes
de universidades, instituciones privadas, etc.