EL PROYECTO


 
 

Introducción

En el 2021, el Archivo General de Puerto Rico, adscrito al Instituto de Cultura Puertorriqueña fue escogido como una de las 17 instituciones subvencionadas bajo el programa “Recordings at Risk” del Council on Library and Information Resources (CLIR). Este programa tiene como enfoque la preservación a través de la digitalización de formatos audiovisuales (audio o video) y de “time-based media” raros y únicos que tengan alto valor para la investigación.

Para el proyecto, se optó por trabajar con 298 cintas de audio de carrete abierto (reel to reel) que pertenecen a los documentos de vigilancia de la Policía de Puerto Rico generados entre las décadas del 60 y 70, dado su considerable valor informativo e histórico. En esta sección se discuten las diversas fases del proyecto, que incluyen trabajos de restauración, digitalización, gestión digital, descripción y futuro acceso.

El equipo de trabajo incluyó a las siguientes personas:

Hilda T. Ayala González: desarrollo de políticas, guías, manuales y preservación digital
Marcos Nieves Díaz: coordinador de labor archivística, descripción y preservación
Néstor Salomón: restauración y digitalización
Alberto Zayas: realmacenamiento, control de calidad y gestión de archivos digitales
Loraine Rosado: desarrollo de metadatos descriptivos
Stephanie Sahir Santiago: digitalización de los documentos suplementarios

 
 

Fase #1: Restauración y digitalización de las cintas magnetofónicas

Las cintas magnetofónicas, que en este proyecto varían entre 3”, 5” y 7”, se consideran soportes vulnerables por los diversos riesgos que pueden afectar el acceso a la información que contienen, entre estos: la hidrólisis, el síndrome de la cinta pegajosa, hongos, polvo y la falta de equipos de reproducción. Para asegurar que las cintas fueran transferidas de forma adecuada, se trabajó con el especialista en restauración Néstor Salomón.

 
 

Néstor Salomón en su estudio de grabación trabajando con la transferencia de las grabaciones de la policía. Imagen: Archivo General de Puerto Rico.

 
 

En primer lugar, las cintas fueron evaluadas para establecer un plan de trabajo acorde con las necesidades de conservación. Según el informe técnico preparado por el especialista: de las 298 cintas, 127 requerían limpieza por presencia de polvo u hongo y solo cuatro presentaban hidrólisis, lo cual fue atendido mediante la deshidratación de la cinta previo a su digitalización.

 
 

Muestra de una cinta con hidrólisis. Imagen: Archivo General de Puerto Rico.

 
 

Una vez la cinta se prepara y es segura su manipulación, se pasa a la fase de captura. Para la digitalización, se tomaron en consideración las mejores prácticas para la creación de objetos digitales. Se seleccionó el formato WAV como master de preservación sin compresión y se capturó a una frecuencia de muestreo de 44 kHz, con una profundidad del bit de 24Hz. Para los archivos de acceso se optó por tres alternativas: wav, mp3 y acc, a una frecuencia de muestreo de 44 kHz con una profundidad del bit de 24 o 16Hz. Además, se estableció una nomenclatura estándar para todos los archivos digitales que incluye: datos del fondo, número correspondiente a la grabación, fecha, canales y versión. Ejemplo: PPR_GRA_0016_1970_1-Master. Finalmente, se estableció una estructura de carpetas digitales para lograr una organización eficiente de los objetos creados y la documentación correspondiente.

De la totalidad de las cintas, cinco estaban vacías y 56 contenían grabaciones en dos lados. En total sumaban 349 archivos de audio, que redundan en 390h:54m:19s de contenido y ocupan 525 Gigabytes de almacenamiento. En esta fase no se realizó edición de audio ni remasterización para mejorar la calidad.

Para más detalles, puede leer el informe audio-técnico completo aquí

Fase #2: Realmacenamiento

Como parte de las estrategias para la conservación a largo plazo de las cintas, estas se transfirieron de los envases originales en que se encontraban a cajas de calidad archivística. Este proceso es importante, ya que los envases originales presentaban manchas de humedad, hongo y sucio. Además, los envases originales eran de cartón, material cuyo componente acídico acelera el deterioro de las cintas. Otro elemento que se tomó en consideración fue la separación de hojas descriptivas, cartas y otros materiales suplementarios en papel que se encontraban dentro de las cajas. Esto representó un reto dual, ya que era necesario prevenir la migración acídica de los papeles a la cinta, pero a la vez evitar la disociación de la información. Para atender este problema, se optó por crear sobres en poliéster en los cuales se colocó este material en papel, creando una barrera entre el papel y la cinta. De esta manera se mantuvo la unidad documental a la vez que se protegía la integridad de los materiales.

 

Izquierda: Envases originales de las cintas. Centro: Cajas preparadas para su almacenamiento a largo plazo. Derecha: Alberto Zayas en proceso de realmacenamiento. Imagen: Archivo General de Puerto Rico.

 
 
 

Fase #3: Gestión de archivos digitales y preservación digital

Los objetos digitales también son vulnerables si no se gestionan de forma adecuada. Estos pueden perderse, corromperse, alterarse o encontrarse en un formato que con el tiempo no pueda reproducirse por cambios tecnológicos. Ante este escenario se tomaron varias medidas preventivas que nos permitirán atender dichos riesgos en el transcurso de la vida útil de los objetos digitales creados bajo este proyecto. Estas medidas incluyen un control de calidad riguroso, la documentación y la revisión periódica de la integridad de los archivos.

Control de calidad
Una vez los objetos digitales fueron recibidos, se realizó un proceso de control de calidad del 100% de los 349 archivos y sus derivados, para un total de 1047 objetos revisados. Se observó: existencia de un archivo máster (excepto en las cinco cintas vacías) y sus derivados; nomenclatura correcta (incluyendo si es uno o dos lados); formato adecuado (master y derivados); si el audio se escucha y tiene principio y fin (o sea, que esté completo); características adecuadas en la profundidad del bit, frecuencia de muestreo y canal; y los metadatos incrustados (duración, profundidad del bit, frecuencia de muestreo, canal, formato, tamaño de archivo digital y tipo). Además, se añadieron otros metadatos importantes: título, procedencia, derechos, fuente y quién realizó la digitalización. Esto fue corroborado utilizando Adobe Audition y documentado para cada formato en una hoja de datos.

Ver hoja modelo: control de calidad

Documentación
Al culminar el control de calidad de los objetos digitales, se procedió con la documentación técnica de los archivos creados. Estos datos, junto al informe audio-técnico preparado por Néstor Salomón, proveen la información necesaria para conocer el soporte y medio original, entender las decisiones tomadas para la captura y la generación de derivados, y poder reproducir los archivos digitales de forma correcta en un futuro. Los datos se dividieron en metadatos de identificación, metadatos técnicos de los originales, metadatos técnicos los archivos digitales y metadatos administrativos. Para identificar y describir el formato original se capturó: código de identificación de cinta, unidad, fondo, subfondo, serie, categoría, título, formato original, tipo de carrete, velocidad de grabación, espesor de la cinta, dimensión de la cinta, tipo de pista, lados, canal, generación, volumen, ecualización, condición de la cinta y duración. Para todos los archivos digitales se capturó: nombre de archivo digital, extensión, tamaño de archivo, duración, tipo de archivo, parte, frecuencia de muestreo, profundidad de bits, reducción de ruido, condición del audio, suma de verificación, ruta del archivo digital, fecha de creación de archivo digital, nombre de creador de archivo digital, estudio de creación, auspicio, número de la subvención, comentarios, quien compiló la información y fecha de compilación.

Ver hoja modelo: datos técnicos

Estrategias de preservación digital
La preservación digital forma parte de todas las fases del proyecto. Dichas estrategias incluyen el diseño de la nomenclatura, la selección de formatos abiertos, bien documentados y ampliamente utilizados por la comunidad, la organización de los archivos digitales y la creación de la documentación técnica y administrativa que se necesita para reproducir de forma adecuada los objetos digitales.

Además, siguiendo prácticas de proyectos similares y las guías federales de digitalización para archivos Broadcast WAVE Files (FADGI), se optó por incrustar los siguientes metadatos en el encabezamiento de los archivos digitales master: Originator, OriginatorReference, Description y OriginationDate. Estos metadatos viajan con el objeto digital durante su ciclo de vida y brindan información importante a los sistemas que preservan su contenido.

También, para documentar y monitorear la integridad de los archivos digitales se realizó un manifiesto de los 349 objetos utilizando la aplicación de código abierto Fixity, desarrollada por AVP. Fixity genera un informe que contiene sumas de verificación, basadas en nuestro caso en el algoritmo SHA-256. Dichas sumas de verifiación luego se utilizan para corroborar si los archivos han experimentado algún cambio desde su creación. Los elementos que informaría la aplicación son: total de archivos, archivos confirmados, archivos movidos o con cambio de nomenclatura, nuevos archivos, archivos con cambios y archivos removidos. Este informe se recibe en el correo electrónico, facilitando el monitoreo de los archivos digitales a través de su ciclo de vida.

Finalmente, para evitar la pérdida del trabajo realizado, se crearon dos copias de resguardo de todos los archivos digitales en memorias portátiles que se ubican en diferentes espacios remotos y una tercera copia de los archivos master en la nube junto con la documentación.

Fase #4: Descripción y acceso al contenido de las grabaciones

Descripción
Para proveer acceso a la información es necesaria una descripción exhaustiva. El audio, contrario al texto, requiere de la transcripción y extracción del contenido para que el usuario pueda beneficiarse de la búsqueda por palabra. En esta ocasión, la descripción se realizó utilizando dos métodos: (1) la información descriptiva que contenía el envase original, la cual asumimos fue preparada por la misma Policía de Puerto Rico y (2) descripciones creadas luego de escuchar los audios para ampliar y corroborar la información detallada en los envases sobre el contenido de las cintas. En esta fase, la transcripción total del audio no fue posible.

 

Loraine Rosado corroborando los datos de las cajas originales contra el audio. Imagen: Archivo General de Puerto Rico.

 
 
 

Los elementos descriptivos que se tomaron en consideración son: título del evento, agrupación, colectivo o gremio, lugar del evento, fecha del evento, participantes principales, descripción del evento, contenido descriptivo de la caja, actividad, categoría, nota de acceso, comentarios adicionales sobre el contenido, comentarios sobre la calidad del audio, tamaño de carrete, si incluye documento adjunto (suplementario) y fecha de la descripción.

Puede descargar el inventario completo aquí: en PDF o Excel

Acceso
Para acceder a las grabaciones de la policía se ha designado una computadora en la Unidad de Música y Sonido y se implementará el “Reglamento para el acceso a las carpetas y otros documentos confeccionados ilegalmente por el estado y transferidos al Archivo General de Puerto Rico para su custodia, preservación y divulgación.” Los interesados deberán comunicarse mediante correo electrónico a agpr_musica@icp.pr.gov para obtener una cita. En el correo electrónico se deberá colocar la siguiente información: nombre, teléfono del solicitante y una descripción lo más aproximada posible de los archivos que consultará. Deberá traer sus propios audífonos para escuchar el contenido.