Publicación semestral   • ISSN 2683-2968   •  Febrero 2024   •  Número de revista 9
DOI: https://doi.org/10.22201/dgtic.26832968e

5/7

Almacenamiento jerárquico

En esta sección se describen las operaciones para acceder a los ejemplares digitales y se establece el vocabulario para aclarar el funcionamiento del almacenamiento en niveles (tiered storage). Después, se exponen conceptos de almacenamiento jerárquico en 3 niveles, su arquitectura y las componentes de una librería de cintas. Concluimos enumerando sus beneficios.

Acceso a los contenidos del acervo
Usando CLAF, cuando un usuario quiere acceder a algún ejemplar del acervo, tiene la opción de visionar un proxy de baja resolución (380x280 pixeles en formato h.264)8 de manera inmediata bajo video en demanda y puede solicitar otro ejemplar del mismo título en más alta resolución como Full-HD o DCP. Ante solicitudes de alta resolución, puesto que nuestro almacenamiento no permite mantener todo el acervo en discos, el ejemplar solicitado tiene que obtenerse de alguna LTO. Entonces, quien atiende la solicitud toma de su nicho la cinta LTO con el ejemplar solicitado, monta la cinta en una unidad de i/o de LTO y copia el ejemplar al almacenamiento en discos del NAS/SAN. Aunque el ejemplar ya en discos puede visualizarse en el laboratorio LCRD, lo común es prestar la copia al solicitante para proyectarla en algún lugar como salas de cine digital o por televisión, incluso, publicarla en video en demanda por la Web si el formato del ejemplar es el adecuado. Nuevamente, la copia del ejemplar en discos eventualmente se eliminará para reutilizar el espacio.

Almacenamiento en 2 niveles
Se dice que un ejemplar está en línea cuando existe una copia en disco y en ese momento puede reproducirse; en nuestro caso el disco corresponde al almacenamiento NAS/SAN. Decimos que un ejemplar está fuera de línea cuando el material está en cinta - o genéricamente en un COD que carece de prestaciones para reproducir sus ejemplares de manera inmediata y en tiempo real (véase la figura 5).

figura 5

Figura 5. Almacenamiento en 2 niveles. Fuente: elaboración propia.         

Almacenamiento jerárquico en 3 niveles
Se dice que un ejemplar está cerca de línea, cuando la LTO que lo contiene está bajo el control de una librería de cintas como la que describiremos (véase la figura 6). Las librerías de cintas son un componente para integrar un almacenamiento jerárquico en tres niveles: en línea, cerca de línea y fuera de línea [14]. Si el lector utiliza otro tipo de COD para preservación como discos ópticos o magneto-ópticos, estos mismos niveles pueden soportarse con rocolas o jukeboxes de discos ópticos o magneto-ópticos en lugar de una librería de cintas. Ambas memorias jerárquicas son lógicamente equivalentes.

Figura 6

Figura 6. Arquitectura del almacenamiento en 3 niveles. La estantería puede omitirse si la librería tiene capacidad suficiente. El ideal es mantener por triplicado librerías espejo remotas. Fuente: elaboración propia.

En la figura 6 se muestra una posible arquitectura de almacenamiento jerárquico en tres niveles:

  • la librería de cintas monta o desmonta en unidades de i/o las cintas LTO bajo su control; sus contenidos están cerca de línea,
  • un sistema MAM similar a CLAF,
  • otro sistema que denominamos agente de servicios de la librería para el MAM,
  • el almacenamiento de rápido i/o, en donde temporalmente residen copias de los ejemplares en línea, y
  • estantería para cintas cuyos contenidos están fuera de línea.

Entre los servicios que el agente ofrece al MAM, dos son básicos: el de lectura que pone en línea ejemplares digitales solicitados, y otro de escritura para copiar íntegramente a LTO unidades de respaldo con metadatos de fijeza e informar al MAM en cuál cinta copió cada unidad de respaldo. El agente también administra la reutilización del espacio en línea.

La fotografía en la figura 7 muestra el interior de una librería de cintas típica. La librería de cintas consta de:

  • Una colección de nichos que aceptan solo una cinta LTO por nicho. Cada cinta tiene su CB que la identifica de manera única.
  • Drives de i/o de LTO, para una o más generaciones LTO, (no visibles en la fotografía).
  • Uno o más brazos robóticos (al frente en la fotografía). Cada brazo “conoce” las coordenadas espaciales de cada cinta en sus nichos; coloca o retira LTOs de los nichos y de las unidades de i/o de acuerdo con su generación LTO indicada en su CB.
  • Un sistema que administra procedimientos de alimentación, movimiento y retiro de cintas, que “conoce” el identificador y la ubicación de cada LTO bajo su control.
Figura 7

Figura 7. Fotografía del interior de una una librería, cortesía de Derrick Coetzee (CCO 1.0). Fuente: https://commons.wikimedia.org/w/index.php?search=Coetzee+tape+library&title=Special:MediaSearch&go=Go&type=image&haslicense=unrestricted

Aplicaciones del almacenamiento jerárquico en 3 niveles
Este almacenamiento jerárquico puede automatizar tareas de acceso y preservación con el beneficio de eliminar la posibilidad de omisión o error por su ejecución manual como hoy se hace en la Filmoteca. Las tareas cotidianas que una librería de cintas puede automatizar son: 

  • El copiado íntegro a LTO de nuevos objetos digitales cuando ingresan al acervo.
  • La puesta en línea de ejemplares solicitados, lo que aminora los tiempos para su acceso.
  • La automatización del chequeo periódico de la fijeza, en beneficio de la preservación del acervo. Proceso que puede detectar e informar sobre ejemplares dañados, e incluso apoyar y tomar acciones para eliminar los daños.

Además, y para enfrentar el continuo cambio tecnológico —que afecta y encarece la preservación del soporte digital—, el almacenamiento en 3 niveles puede crecer para mantener cerca de línea cantidades gigantescas (del orden de exabytes [14]) y ayudar para controlar otros procesos eventuales e ineludibles como:


  • Renovar el soporte físico (COD) o sustituir aquellos que se detecten dañados.
  • Migrar todo un acervo copiándolo de manera íntegra a CODs de diseño más reciente y económico. El caso particular de la evolución de generaciones LTO es interesante [6].
  • Transcodificar objetos digitales a nuevos formatos para la preservación de su reproducibilidad.

8 Este proxy invariablemente se genera en la unidad de respaldo de todo proyecto de digitalización y/o restauración. Al concluir el proyecto, su proxy se copia a otra unidad lógica de 4TB dedicada exclusivamente a soportar el visionado en línea de los títulos en soporte digital.

Fecha de recepción: marzo 30, 2023
Fecha de publicación: febrero, 2024

TIES, REVISTA DE TECNOLOGÍA E INNOVACIÓN EN EDUCACIÓN SUPERIOR (www.ties.unam.mx) 2024, Año 5, No. 9, febrero 2024, es una publicación semestral editada por la Universidad Nacional Autónoma de México (UNAM), Ciudad Universitaria, Alcaldía Coyoacán, C.P. 04510, Ciudad de México, a través de la Dirección General de Cómputo y de Tecnologías de Información y Comunicación, (DGTIC), Circuito Exterior s/n, Ciudad Universitaria, Alcaldía Coyoacán, C.P. 04510, Ciudad de México, Teléfono: (55) 56228166, https://www.ties.unam.mx, revista.ties@unam.mx. Directora editorial: Dra. Marina Kriscautzky Laxague. Número de reserva de Derechos de Autor otorgado por INDAUTOR: 04-2019-011816190900-203 ISSN: 2683-2968, ambos otorgados por el Instituto Nacional del Derecho de Autor. Responsable de la última actualización de este número, Dirección General de Cómputo y de Tecnologías de Información y Comunicación, (DGTIC). Circuito Exterior s/n, Ciudad Universitaria, Alcaldía Coyoacán, C.P. 04510, Ciudad de México, fecha de la última modificación, diciembre de 2022. El contenido de los artículos es responsabilidad de los autores y no refleja el punto de vista de los árbitros, del Editor o de la UNAM. Se autoriza la reproducción total o parcial de los textos aquí publicados siempre y cuando se cite la fuente completa y la dirección electrónica de la publicación. La revista se ha desarrollado sin fines de lucro, con finalidades de diseminación del conocimiento, bajo licencia Creative Commons Reconocimiento-NoComercial (CC BY-NC-SA 4.0). Hecho en México, 2024.