12. GESTI?N DE DATOS: PRINCIPIOS ARCHIV?STICOS EN UN ENTORNO BASADO EN FICHEROS
Las principales acciones de archivo digital tienen que ver con la preservaci車n de bits, es decir, con un conjunto de acciones que mantengan la integridad de los datos digitales (?corrientes de bits?) que gestiona la instituci車n responsable.
M芍s all芍 de la preservaci車n de bits habr芍 que actuar, en 迆ltima instancia, cuando el formato del contenido quede obsoleto. La acci車n m芍s com迆n consistir芍 en migrar de formato, aunque (como se se?ala en los comentarios de la secci車n 10) puede haber contextos en los que se requiera la emulaci車n del sistema. Mientras que las decisiones sobre la preservaci車n de bits pueden confiarse a los especialistas en tecnolog赤a de la informaci車n y las aplicaciones y los equipos inform芍ticos apropiados, las acciones m芍s all芍 de la preservaci車n de bits deber芍n contar con la participaci車n de profesionales del 芍mbito de la conservaci車n. Lo que est芍 en juego requiere tener en cuenta las propiedades significativas del contenido y las caracter赤sticas de la comunidad de investigadores a la que se presta servicio, as赤 como una evaluaci車n de la obsolescencia de los formatos y las opciones de nuevos formatos de destino. La gesti車n de datos debe observar los siguientes principios b芍sicos:
- Por regla general los ficheros llegan a nuestro sistema de almacenamiento mediante un copiado. Este proceso debe generar duplicados que puedan verificarse como id谷nticos a los originales. La comprobaci車n de la integridad de los datos se hace mediante la creaci車n previa de una suma de verificaci車n, tambi谷n conocida como hash o digest. El proceso de verificaci車n debe tener lugar justo despu谷s de la creaci車n de la copia, y a poder ser como procedimiento automatizado.
- La integridad en el tiempo de los datos del contenido digital debe verificarse peri車dicamente para garantizar que se puedan leer exactamente como se escribieron, sin errores ni alteraciones.
- Sin embargo, dependiendo del formato de fichero original, puede ser preferible transcodificar a un nuevo formato de destino en lugar de copiar el fichero original sin m芍s (v谷anse las secciones 10 y 11). Este proceso se conoce como migraci車n de formato.
- El contenido digital, ya sea basado en un fichero o en un soporte f赤sico, debe copiarse a un nuevo soporte f赤sico antes de que se produzcan errores no corregibles. Cuando los formatos original y de destino son los mismos, este proceso se conoce como migraci車n de refresco o de medios.
- Es esencial conservar al menos dos copias de preservaci車n digital, y si pueden ser m芍s, mejor, y utilizar otras copias para el acceso, seg迆n convenga. Las copias de preservaci車n deben guardarse en distintos lugares geogr芍ficos siempre que sea posible. El uso de diferentes tecnolog赤as de almacenamiento para cada conjunto de copias de preservaci車n puede aportar una seguridad adicional. Al elegir las tecnolog赤as que se van a utilizar hay que tener presente que una estrategia ser芍 tan robusta como su eslab車n m芍s d谷bil.
- Deben hacerse copias de acceso siempre que sea posible. Sin embargo, a diferencia de lo que ocurre con los ficheros maestros, esas copias de acceso o de distribuci車n pueden modificarse subjetivamente, seg迆n las necesidades de los usuarios. Asimismo se puede emplear la reducci車n de datos cuando sea compatible con las peticiones de los usuarios. Como ocurre en los procesos de creaci車n de ficheros maestros de preservaci車n, en este caso tambi谷n es esencial documentar cuidadosamente todos los par芍metros y procedimientos empleados.
- Siempre que sea posible, las comprobaciones para garantizar la integridad de los datos ser芍n autom芍ticas, como ocurre en los repositorios digitales de confianza. Si ello no es posible, se recurrir芍 a las comprobaciones manuales sobre una base estad赤sticamente significativa.
Comentario:
Si bien estos principios se aplican por igual a cualquier forma de preservaci車n digital, el gran tama?o relativo de los ficheros y la naturaleza temporal del contenido audiovisual exigen considerar con atenci車n las capacidades de almacenamiento y de ancho de banda.
Esencialmente, estos principios son los mismos que los recomendados para el mundo anal車gico. Sin embargo, una diferencia fundamental es la dimensi車n cualitativa del mundo digital basado en ficheros, que permite la validaci車n objetiva de la integridad de las grabaciones. La supervisi車n peri車dica de la integridad de los datos es una de las obligaciones fundamentales de las rutinas de preservaci車n digital. Los soportes y sistemas digitales pueden fallar y fallan, sin previo aviso, en cualquier momento. Las estrategias para reducir al m赤nimo los riesgos para los ficheros digitales se basan, en gran medida, en la conexi車n en red entre la colecci車n primaria, el usuario y las copias de seguridad.