Wikimedia Argentina/GLAM/Proyecto de digitalización/Recursos/Manual de procesos (DGLBYPL)

From Meta, a Wikimedia project coordination wiki
Jump to navigation Jump to search

Nota: Este manual, es específico para el trabajo en la Biblioteca Circe de la Red de Bibliotecas Públicas del Gobierno de la Ciudad de Buenos Aires.

El documento original, se encuentra aquí.

Manual de Procesos - Digitalización en la Red de Bibliotecas Públicas de la Ciudad Autónoma de Buenos Aires[edit]

Logo Digitalización - WMAR.svg


Con el apoyo de Mecenazgo Cultural de la Ciudad.

Sello Mecenazgo Cultural.svg


Wikimedia Argentina logo - horizontal.svg Bibliotecas GCBA 2018.svg

Escáner[edit]

Uso[edit]

Mantenimiento[edit]

  • Verificar que los tornillos y tuercas se encuentren fijos.
  • Verificar el estado de la soga de tensión, utiliza una soga elástica de 8mm
  • Verificar que los rulemanes giren adecuadamente.
  • Verificar que las platinas (vidrios) se encuentren dentro de su encastre, y sin rayones o rajaduras.
  • Verificar el correcto desplazamiento y traba de la cuna de libros.
  • Verificar el cableado eléctrico.
  • Verificar que la estructura de madera no tenga elementos flojos o sueltos.

Cámaras[edit]

Características[edit]

Se utilizan dos cámaras Nikon D5300, con lentes 18-55mm AF-P. Datos: https://es.wikipedia.org/wiki/Nikon_D5300 La batería dura aproximadamente unos 1100 disparados, lo que permite realizar alrededor de 2000 páginas entre cargas.

Partes[edit]

Cada cámara se divide en 5 componentes.

  • Cuerpo
  • Lente
  • Memoria
  • Batería
  • Conector del disparador

Problemas conocidos[edit]

Cada tanto suele aparecer en alguna de las cámaras, un error respecto a las memorias MicroSD, lo cual se soluciona sacando y colocando la misma repetidamente hasta que es detectada correctamente. No se presentaron problemas de corrupción de datos en la mismas hasta ahora. El problema solo se presenta con las memorias MicroSD en su adaptador. Solucionado al utilizar memorias SD (de formato completo).

Configuración[edit]

El tamaño de apertura óptimo es de 24mm, con el punto blanco indicador sobre el número “2” para que los libros sean visualizados de forma completa y la resolución sea óptima.

Computadora[edit]

Características[edit]

Dos discos rígidos de 240gb SSD en RAID 1.

Dos discos rígidos de 4tb convencionales en RAID 1.

Buen uso[edit]

Evitar utilizar el equipo para otros usos que no sean los de digitalización, especialmente la descarga de archivos e instalación de software. No apoyar líquidos o alimentos sobre sus componentes, aunque se encuentren cerrados.

Programas[edit]

Windows 10

Abby FineReader 14

ScanTailor

GIMP

Nikon Transfer

AntRenamer

Estructura de archivos[edit]

Carpetas de Trabajo:

  • Descargas
  • Documentos
    • Revisar
    • Terminados
  • Almacén

Cada ítem que se esté digitalizando, se guarda bajo una carpeta de trabajo con la denominación “Título - Autor (volumen o fecha)” o “Título (fecha de publicación)”, bajo la carpeta “Descargas” Una vez finalizado el trabajo, se ubica bajo la carpeta “Revisar” hasta que otra persona revise que el PDF final cumple con todas las características, de haber sido realizado de forma correcta se reubica bajo la carpeta “Terminados”. Semanalmente se mueven todas las carpetas bajo “Terminados” a la carpeta “Almacén”. Los archivos que se encuentren bajo la carpeta “Almacén” se encuentran en el disco secundario, y no deben ser modificados. Para trabajar en ellos deben ser movidos a la carpeta “Descargas” y repetir el proceso anterior. Nota: Se debería mejorar la denominación en proyectos futuros, para incluir el número de inventario.

Actualizaciones[edit]

Se debe verificar semanalmente que los siguientes programas se encuentren actualizados:

  • Windows Update: Diariamente (automático)
  • Abby FineReader: Mensualmente (automático)
  • ScanTailor Advanced: Semestralmente

BackUp[edit]

Los BackUp se realizan de forma mensual, en un disco externo de 4tb que permanece en DGLByPL (Güiraldes) durante el resto del tiempo. Se debe utilizar el programa “WD BackUp” para realizar los backups.

Nikon Transfer[edit]

Ese software que viene de forma gratuita con las cámara Nikon, se utiliza para transferir archivos desde la memorias o cámara, a las carpetas de trabajo.

Parámetros[edit]

Predefinidos.

Uso[edit]

Se debe configurar al momento de importar las imágenes, la carpeta de destino y el nombre del archivo, indicando con “A” o “B” si se trata de la página izquierda o derecha.

AntRenamer[edit]

Este software se utiliza para renombrar archivos de forma masiva, si se encontrase una discrepancia en el orden de los mismos.

Parámetros[edit]

URL: http://antp.be/software/renamer

Se utiliza con los parámetros por defecto, se configura según el uso.

ScanTailor[edit]

Características[edit]

URL: https://github.com/4lex4/scantailor-advanced/releases

Versión: 1.0.16

Este programa se utiliza para ordenar y procesar las imágenes obtenidas en bruto de las cámaras. Consta de un total de seis pasos principales, y como resultado nos devuelve archivos TIFF. Es el principal programa del post-proceso, y el que demanda más tiempo y práctica.

Parámetros[edit]

Los parámetros del programa deberían quedar fijos. Ver uso para los variables. Se recomienda que la aceleración por hardware, este siempre activa.

Uso[edit]

Vídeo: https://www.youtube.com/watch?v=DRaDoCKVsrE


Proyecto nuevo -> “Directorio de entrada” Examinar: seleccionar los archivos renombrados

OK-> Todas las páginas -> Todas las páginas: PPP en 300x300 -> Aplicar

>imagen<

  1. Corregir orientación
    1. Rotar páginas hacia la derecha e izquierda.

>imagen<

  1. Dividir páginas
    1. Utilizar el procesamiento en lotes (botón verde de play).
    2. Revisar que las páginas hayan quedado correctamente identificadas, en especial el borde pegado al centro.
    3. Revisar correlatividad del libro.

>imagen<

  1. Enderezar
    1. Utilizar el procesamiento en lotes (botón verde de play).
    2. Revisar y corregir las páginas.
  2. Seleccionar contenido
    1. “Caja de página” debe estar deshabilitado.
    2. “Caja de contenido” debe estar en automático.
    3. Utilizar el procesamiento en lotes (botón verde de play).
    4. Revisar páginas, siempre a borde de texto. Evitar sellos que distorsionen mucho el tamaño de las mismas.
  3. Márgenes
    1. Todos los márgenes en 3mm. Aplicar a todas las páginas.
    2. Todos los márgenes centrados. Aplicar a todas las páginas.
    3. Desmarcar “igualar el tamaño con otras páginas” para la tapa, contratapa, y desplegables.
    4. Márgenes 0mm en tapa y contratapa.
    5. Textos que no posean un área de texto fija, y por consecuencia algunas páginas están centradas incluyendo número de página, etc, se deben mover hacia arriba y ajustar márgenes en consecuencias.

>imagen<

  1. Salida
    1. Utilizar el procesamiento en lotes (botón verde de play), aunque existan páginas a color, con imágenes, etc.
    2. Opciones predefinidas. Variar el “Umbral” si el texto no es claro, aplicar a todas las páginas.
    3. En páginas con texto e imágenes, aplicar el modo “Mixto”
    4. En páginas completamente a color, como pueden ser tapas, contratapas o portadas, aplicar el modo “Color”
    5. En páginas con texto simple, en colores, activar la opción “segmentación de los colores”
    6. Utilizar “Zonas de imágen” cuando el modo automático no las detecte correctamente.
    7. Utilizar “Rellenar zonas” para sacar manchas de las páginas.

>imagen<

Abby FineReader[edit]

Características[edit]

URL: https://www.abbyy.com/es-la/finereader/

Este programa se utiliza para realizar el OCR (reconocimientos de caracteres) y obtener el archivo en formato PDF.

Parámetros[edit]

Uso[edit]

Wikimedia[edit]

Copyright[edit]

Libros publicados hace 95 años (<1925). (y el autor muerto hace > 70 años)

Fotos anteriores a 1976, por URAA.

Commons[edit]

Ficha[edit]

Ejemplo: https://commons.wikimedia.org/wiki/File:Bases_y_puntos_de_partida_para_la_organizaci%C3%B3n_pol%C3%ADtica_de_la_Rep%C3%BAblica_Argentina_-_Juan_Bautista_Alberdi.pdf Se utiliza este template: https://commons.wikimedia.org/wiki/Template:Book Se debe agregar un ítem de Wikidata para la edición del libro, y el enlace al catálogo de la DGLByPL con el número de inventario. Las plantillas de fuente y permiso, son siempre las mismas.

Categorías[edit]

Todos los libros deben estar bajo la categoría: https://commons.wikimedia.org/wiki/Category:Files_from_Direcci%C3%B3n_del_General_Libro,_Bibliotecas_y_Promoci%C3%B3n_de_la_Lectura Adicionalmente, también bajo la categoría del escritor y de la serie si tuviesen más de 4 volúmenes.

Wikidata[edit]

Ficha[edit]

Ejemplo: https://www.wikidata.org/wiki/Q55444920 Declaraciones mínimas: Instancia (siempre Q3331189), Título, Autor (o nombre del autor), Lugar de publicación, Fecha de publicación y Fichero digitalizado en Wikimedia Commons. Adicionales: https://www.wikidata.org/wiki/Wikidata:WikiProject_Books

Identificador BNMM[edit]

Siempre que sea posible se debe agregar el identificador de la Biblioteca Nacional Mariano Moreno., que se obtiene de: https://catalogo.bn.gov.ar como “No de Sistema”.