Copias de Seguridad (BackUp)
 Las copias de seguridad son una forma de protección de datos tal que permiten la recuperación de la información (ya sean datos o aplicaciones) en el caso de que tenga lugar la pérdida del equipamiento informático (o hardware), ya sea debido a desastres naturales, fallos de disco, espionaje, errores de operación del sistema, etc.

Todos y cada uno de los aspectos relacionados con las copias de seguridad deben estar claramente especificados en lo que se conoce como Política de BackUp. Se trata de un documento donde han de figurar, entre otros, la periodicidad con la que se realizan las copias, el/los métodos empleados para su realización (absoluto, incremental o combinación de ambos), los datos de los que se va a realizar copia, los responsables de realizarlas, ...
 De igual importancia que la protección física del equipamiento es la protección de los medios empleados para realizar las copias de seguridad. Por ejemplo, la ubicación final de los dispositivos de backup y alternativamente los medios de almacenamiento debe realizarse en una zona alejada respecto de la sala de equipamiento informático. El fin es evitar que una misma catástrofe (como un incendio) destruya tanto equipos como copias.A su vez, la protección física de las copias ha de ser acorde con la que se aplica al equipamiento, dependiendo de la naturaleza de la información que recogen (sensibilidad de los datos, ...).
Relacionado también con el tema de la seguridad, es el etiquetado de los medios donde se realizan las copias de seguridad (cintas, CD-ROM, ...). Éste suele hacerse generalmente con excesivo detalle acerca de su contenido, de modo que el proceso de recuperación de un archivo determinado es relativamente rápido. A su vez, tanta información puede suponer una pérdida de confidencialidad de cara a un intruso que consiga acceso a las copias. Por contra, resulta imprescindible recurrir a algún método de etiquetado que evite tener que pasar por todas las copias para obtener la información. Dicho etiquetado deberá, por tanto, seguir una codificación determinada que únicamente conozcan los administradores y los encargados de realizar las copias de seguridad.
Otro detalle muy importante es la comprobación de las copias realizadas, de modo que se garantice la integridad de los datos almacenados. Para ello, en lugar de restaurar y comprobar la copia entera se suele optar por la recuperación de diversos archivos escogidos de modo aleatorio, asumiendo que la copia es correcta en caso de que no se produzcan errores. 
En lo que respecta a los medios de almacenamiento más comunes  podemos encontrar:
 

 
Los discos flexibles, en detrimento, no suelen ser la opción más acertada ya que presentan baja fiabilidad y capacidad de almacenamiento (si bien su coste es también reducido). Basta con acercarlo a una fuente de radiación (un electroimán, ...) para que se borre parte de, o toda, la información contenida.
Los discos duros, ya sea de forma completa o una partición, presentan mayor fiabilidad y capacidad. Además pueden usarse a través de un sistema de ficheros, o como un dispositivo secuencial (manejable con la orden tar). En otras situaciones, si el disco destinado a backup posee las mismas características que el empleado para el sistema, se puede recurrir a la orden dd para realizar la copia, con lo que se obtiene un replicado exacto y funcional del original.
Las cintas magnéticas, continuan siendo en la actualidad el método más extendido para realizar copias de seguridad. Basadas originalmente en sistemas para almacenar video (cintas de 8mm), han ido evolucionando hacia sistemas con una menor tolerancia a la corrupción de los datos (ya que mientras la pérdida de unos pocos bytes en un stream de video no supone un problema, sí puede resultar fatal en el caso de un backup), hasta el standard actual correspondiente a las cintas DAT de 4mm (DDS 3 y 4). Este tipo de medio ofrece elevadas capacidades de almacenaje (a partir de 4Gb, correspondiente a las cintas de 90m), que puede verse incrementado en el caso de que el lector ofrezca compresión hardware de datos (lo que puede causar cierta dependencia con el fabricante de la unidad lectora, introduciendo posibles problemas de compatibilidad con otras lectoras).
La implantación en los ultimos años de grabadoras CD-ROM tanto en equipos ofimáticos o de escritorio como en estaciones de trabajo, ha permitido la introducción de un nuevo soporte de backup: el cdrom. Si bien la capacidad de almacenamiento (700Mb) no puede compararse con el de las cintas DAT, el reducido coste de los cdroms (normales o regrabables) compensa en muchas ocasiones su empleo (dependiendo siempre del volumen de datos). De uso menos extendido, por el momento, debido al coste tanto de las unidades grabadoras como de los soportes, es el DVD. Dicho medio es el heredero del CD-ROM, y es de esperar que acabe desplazándolo con el tiempo.
Existen actualmente mayor número de soportes para la realización de backups, con prestaciones y precios comprendidos entre los anteriores. Ejemplos son unidades Iomega (Jazz o Zip), Superdisk, memorias USB, ...
Otro detalle a tener en cuenta a la hora de escoger un soporte de backup, es el tipo de acceso que se pretende realizar a los datos. Mientras que discos y cdroms ofrecen un acceso aleatorio (es decir, implementan un sistema de ficheros), las cintas únicamente permiten el acceso secuencial, lo que introduce una espera asociada al posicionamiento del cabezal sobre el punto adecuado de la cinta.

Finalmente, entre las distintas modalidades existentes para realizar copias de seguridad, puede optarse bien por la realización de una copia completa de la información (backup de nivel 0), o por guardar únicamente los archivos modificados desde la última copia (nivel 1, y sucesivos niveles en función del nivel de referencia). La copia de nivel cero supone la política básica para realizar backups, y se caracteriza por su simplicidad (tanto de generación de las copias como de recuperación); por contra es el método que más recursos consume (tanto de soporte como de tiempo). En cambio, las copias de niveles superiores o backups incrementales (o progresivos) requieren menor duración y capacidad para su realización (dado que únicamente almacenan aquellos datos que han sido modificados desde la última copia de referencia), siendo su principal desventaja la dependencia con los niveles inferiores a la hora de recuperar la totalidad de los datos. A la vista de los distintos métodos suele ser muy habitual emplear combinaciones de ambos, de modo que se realicen backups de nivel cero con cierta periodicidad, entre los que se intercalan varias copias incrementales (de primer nivel habitualmente). En cualquier caso, la elección de este tipo de política se ve afectada por la naturaleza del soporte empleado para relizar la copia de seguridad.
 

Políticas de BackUp
 Una política de backup debe comprender en mayor medida todos los aspectos de una copia de seguridad, entre los que cabe mencionar:
 

 La elección realizada en cada apartado debería asegurar la optimalidad del sistema de backup escogido.
 

Caso práctico
 

  1. El sistema del que se pretende realizar copias de seguridad está formado por una granja de cálculo y diversos puestos de trabajo (de tipo ofimático y representación gráfica). Todos ellos pertenencen a una subred privada, obteniendo acceso al exterior a través de un router con NAT y mejorando de este modo la seguridad interna.
  2. Las copias se van a realizar en tres soportes distintos: Disco duro, Cintas DAT y CD-ROM. Los dos primeros están situados en un servidor de backup, mientras que las copias en cdrom se realizarán de modo local en cada estación de trabajo (todas poseen grabadora de cdrom). El servidor de backup consta de 6 discos SCSI de 73Gb cada uno y una controladora RAID en placa. Además tendrá conectada una unidad externa para cintas DAT con compresión por hardware.
  3. Los puestos de trabajo, comparten (previa autenticación del usuario local o del usuario de copia remoto) el directorio de documentos ubicado en una partición de 2Gb. En principio dicho directorio no contempla la presencia de datos sensibles. El backup de éstos (documentos con datos personales) queda bajo la responsabilidad del usuario del puesto de trabajo, y se presupone que será realizado en cdrom.
  4. De las granjas de cálculo únicamente se realizará un backup de sistema en caso de instalación o actualización, y del directorio local donde residan los programas de cálculo (/opt o /usr/local). La presencia de resultados en las granjas será obviada y es responsabilidad del usuario hacer copia local en su puesto de trabajo habitual.
  5. En lo que respecta al servidor de backup, las copias (empleando el comando tar o smbtar) se almacenarán de modo jerárquico y estructurado en subdirectorios por cada estación de trabajo, distribuyéndolas en tres de los discos (RAID 5, software). A su vez, estos tres discos serán replicados en los otros tres (RAID 1, hardware).
  6. Existirán dos juegos completos de cintas DAT de modo que sea posible volcar a cinta el contenido completo de los tres discos en el servidor de backup, ambos juegos de cintas se irán permutando cíclicamente.
  7. La periodicidad con la que se realicen las copias dependerá del soporte: la copia a disco se hará semanal, automatizándola para que comience cada sábado a partir de las 22:00. Las copias en cinta serán quincenales y se realizarán en lunes en horario de trabajo (a partir de las 9:00) dado que se presume la necesidad de emplear varias cintas para realizar el backup. En el caso de los datos personales de las estaciones de trabajo, el tiempo transcurrido entre las copias de seguridad dependerá de la elección del usuario.
  8. Todos los backups serán absolutos.
  9. La realización de los backups en cinta será realizada por cualquiera de los usuarios pertenecientes al grupo, y consistirá únicamente en ir cambiando las cintas bajo demanda (el inicio del backup estará programado y se realizará de modo automático). Si bien, se llevará un registro del usuario responsable de una determianda copia, fijado con anterioridad con opción a introducir cambios (sustituciones, ...).
  10. Las cintas se almacenarán en un despacho separado del laboratorio, en un armario con llave. Si bien laboratorio y almacén están en el mismo edificio. El único etiquetado de las cintas corresponderá con un identificador: I-1/n, ..., I-n/n o II-1/n, ..., II-n/n.
  11. El control de la integridad de las copias se realizará a través del empleo de checksums (md5, ...), escogiendo un procentaje de archivos aleatorios (cuyo número dependerá de la carga del systema y del volumen de datos almacenados), y contrastándolos con los originales. Esto se realizará tanto en las copias en disco, como en cinta, una vez finalizada la copia. En caso de que se detecten inconsistencias en los datos, se procederá a repetir de modo automático el backup. Si se detecta una segunda inconsistencia se ha de reportar el error al administrador para analizar las causas (fallo de comunicaciones, de soporte, ...).
Se baraja la posibilidad de introducir capas de criptografía tanto a nivel de cinta (via openssl empleando pipes) como de disco (sistema de ficheros encriptado  tipo tcfs, loopy, cfs, ...), una vez el sistema esté en correcto funcionamiento.
 
 

Bibliografía
 La mayor parte de los conceptos se han obtenido del manual "Seguridad en UNIX y Redes" (v2.1), y de los apuntes tomados en clase de la propia asignatura (F39, plan 1991). Para la elaboración de las políticas de backup se ha hecho uso de ejemplos encontrados en internet, procedentes de universidades, instituciones privadas, etc.