De Goobi a SIMURG: un ciclo

Carolina Santamarina de la Varga. Unidad de Recursos de Información Científica para la Investigación (Madrid)

Versión en pdf

Ver en Digital.CSIC

 ¿Qué hace Goobi?

La adquisición e implementación del software Goobi y su visor asociado, junto con un escáner aéreo, responde al cambio en la política de digitalización de la Red de Bibliotecas y Archivos del CSIC. Fuera aparte de que se puedan seguir externalizando proyectos de digitalización, la Red  ha adquirido a través de estas herramientas la autonomía y la flexibilidad necesaria para poder seguir manteniendo un flujo constante de crecimiento de fondos digitalizados.

La tarjeta de presentación de los fondos digitalizados del CSIC es el portal SIMURG, que nos muestra a todos los interesados, curiosos, especialistas y profesionales, el patrimonio bibliográfico custodiado en la Red de Bibliotecas y Archivos del CSIC.

Pero para llegar a visualizar esas páginas, ¿qué hay detrás?

Se puede pensar, que una vez digitalizado el libro, simplemente se trata de subirlo a un portal web y difundirlo. Se podría hacer eso, sin embargo, con ello estaríamos teniendo en cuenta sólo la difusión, que indudablemente es el objetivo último y primero de la digitalización. Pero hay que tener en cuenta que la digitalización es un proceso costoso, no sólo económicamente, sino también y sobre todo, en recursos humanos, y en requisitos técnicos (hardware y software).

Además de la difusión, otro de los motivos para digitalizar es la conservación de los originales, pero al digitalizarlos, también estos originales, sufren.

Así es que por estas razones y algunas más, es recomendable desarrollar unas políticas de digitalización que busquen la perdurabilidad.  

Y en esta tarea es dónde tiene un rol el software Goobi.

Goobi tiene tres funciones importantes a destacar:

1.      es una herramienta de control de flujo de trabajo en el desarrollo de proyectos

2.      es una herramienta de indización (“mapa estructural” en vocabulario de Goobi) de cada obra o volumen.

3.      es una herramienta de generación de metadatos de preservación según el formato METS. 

Goobi está concebido para un desarrollo de proyectos de digitalización regular y de forma distribuida, de ahí que sea una aplicación web.

Regular,  implica la idea de proceso cotidiano. Está pensado para que esta nueva tarea, la digitalización, se incorpore a las funciones habituales y diarias de la institución.

Y distribuido, porque en el desarrollo de un proyecto debe  haber varios actores que intervengan, desde diferentes emplazamientos: así será el técnico el que revise la calidad de las imágenes y las recorte o las ensamble, etc. y el bibliotecario/archivero, quién tenga que hacer la paginación, indización, o corregir los metadatos que considere. 

Goobi juega un papel determinante en esta tarea, indudablemente laboriosa. En primer lugar es siempre optativo hacerlo o no, será el experto quién valore la necesitad y en segundo lugar, Goobi permite la realización de esta tarea en cualquier momento, incluso, después de que esta obra haya sido ya difundida en el portal. Para  hacer esta tarea, Goobi ofrece una interfaz muy amigable que simplifica mucho el trabajo.  

Esta indización y paginación de la obra, no es sólo un valor añadido en la difusión de la obra, sino que este “mapa estructural” queda grabado en los metadatos que Goobi elabora y esto sigue siendo un elemento de preservación.

No olvidemos que en caso de daño técnico del servidor, esta información nos permitiría la “reconstrucción” del orden y estructura de la obra. 

Goobi crea unos ficheros externos de metadatos, según el estándar METS por cada volumen. Estos ficheros recogen, además de la relación imagen-página y  la indización, también la información técnica necesaria para la preservación (pixeles de la imagen, checksums, etc.) Además cada fichero de metadatos incluye información bibliográfica que luego a través del visor se mapea a  varios estándares bibliográficos, como DC, MODS, etc.

De forma interna, Goobi escribe la cabecera de los Tiffs, con algunos campos de  información bibliográfica que extrae de Aleph. 

Y cuando todos estos procesos técnicos están realizados, Goobi envía tanto las imágenes como los ficheros mets al CABAS, el espacio de preservación que dispone el CSIC.

¿Cómo se trabaja con Goobi? 

Como ya hemos indicado arriba, una de las tres funciones de Goobi es la gestión del flujo de trabajo, así es que para terminar este artículo, vamos a explicar de una manera muy somera, como se trabaja a nivel práctico con Goobi. 

Lo primero que se debe hacer, si se tiene ya programado la digitalización de una obra o de un conjunto de obras, es crear el proyecto en Goobi.

Esto se hace en la URICI, introduciendo los parámetros técnicos adecuados, asignando una colección digital (puede ser la general o una específica, que la biblioteca o archivo nos  haya indicado) y elaborando un flujo de trabajo para ese proyecto. 

Cuando esto está hecho, la biblioteca/archivo/o la URICI, importa los registros bibliográficos incluidos en el proyecto, a través de un simple click y a partir de ahí, este registro (o “proceso” en terminología de Goobi) entra en el flujo de trabajo. Como es una aplicación web, aunque las tareas estén asignadas a las bibliotecas/archivos, la URICI siempre podrá colaborar y dar apoyo en las tareas. 

Un ejemplo de flujo de trabajo básico sería este: 

Nº tarea

Tarea

Actores

comentarios

1

Envío de los libros/doc. a la sala de escáner

Biblioteca/Archivo

En este caso, sería enviar los materiales a la sede de la URICI

2

Carga de imágenes a Goobi

Operador de escáner

 

3

Control de calidad

Responsable técnico

Se debe tener el ejemplar físicamente.

4

Se procesan las imágenes

SCRIPT

Todas las tareas que tienen que ver con la generación de derivados, recorte de imágenes, etc..  se realizan en la URICI

5

Devolución del libro

 

 

6

Mapa estructural

Biblioteca/Archivo

Se debe tener el ejemplar físicamente.

7

Exportación al visor

Biblioteca/Archivo/URICI

Esto es una tarea de un click.

8

Mets de preservación

SCRIPT

 

9

Borrado de tiffs

Tarea automática

 

 

El paso 1 y 6 están resaltados ya que son los únicos trabajos a cargo de las bibliotecas/archivos:

  • El movimiento de los fondos (envío y recepción).
  • La revisión de los metadatos que se importan desde aleph junto con la paginación e indización de la obra si se considera pertinente.

Volver al índiceSubir