domingo, 8 de junio de 2025

Aplicación de la Inteligencia Artificial (IA) en la archivística universitaria y de investigación

La inteligencia artificial (IA) está sacudiendo todos los terrenos en los que se introduce, y el mundo de la archivística también siente su impacto.

Su aplicación en archivos, principalmente universitarios y de investigación, nos abre un amplio panorama en cuanto a la optimización de tareas, la mejora en el acceso a la información y el fortalecimiento del valor de los fondos documentales que se custodian.

Lo importante es comenzar poco a poco, con objetivos claros y realistas, y apoyarse en comunidades y recursos existentes.



¡Dejemos claro una cosa …! La IA no sustituye al archivista, sino que le aporta herramientas potentes para enriquecer su trabajo. En el contexto universitario, su potencial es enorme: desde facilitar la investigación hasta agilizar la gestión documental. 


La IA como “archivera”

La IA, mediante técnicas como el procesamiento del lenguaje natural (PLN) y la visión artificial*, logra la extracción de metadatos de documentos escaneados, también nos auxiliará en el poder generar descripciones automáticas (palabras clave, abstracts, nombres, etc.), incluso el reconocimiento de texto manuscrito en fondos históricos (HTR Handwritten Text Recognition, ) a través de modelos entrenados, un ejemplo la herramienta Transkribus. Todo esto, se englobaría en la labor de la descripción archivística.

En cuanto al proceso de clasificación y organización documental, existen soluciones IDP (Procesos Inteligentes de Documentos) capaces de clasificar automáticamente documentos en series o tipologías, según su contenido.

Además de identificar duplicados o versiones mediante análisis de similitud semántica y/o visual. La detección de un contenido sensible (como son los datos personales) para facilitar el tratamiento correcto y conforme a la normativa de la protección de datos.

En cuanto a la búsqueda de información y recuperación documental, la IA permite, mediante motores de búsqueda semánticos:

Buscar por conceptos y no solo por palabras exactas.

Responder preguntas sobre el contenido (tipo "¿qué decisiones tomó el consejo de gobierno en 1995?" en vez de “consejo de gobierno 1995”).


El problema del comienzo …  ¿Qué se necesita para empezar?

Recursos básicos

Digitalización y organización previa de los fondos.

Acceso a herramientas compatibles (algunas gratuitas, otras con coste).

Personal con conocimientos básicos en tratamiento documental y disposición a aprender nociones clave de IA.


Herramientas accesibles.  

Aquí os dejo unos ejemplos:

Finalidad: Transcripción manuscrita. Herramienta: Transkribus. Observaciones: Gratuita para uso limitado; muy útil en fondos antiguos.

Finalidad: Clasificación documental. Herramientas: Doccano, LightTag. Observaciones: Herramientas de código abierto para entrenar modelos.

Finalidad: OCR mejorado. Herramienta: Tesseract + IA. Observaciones: Se puede integrar en flujos de trabajo simples.

Finalidad: Búsqueda semántica. Herramienta: ChatGPT, Haystack. Observaciones: Se puede entrenar un modelo con tu fondo documental.


Retos y precauciones

  • Privacidad y protección de datos: La IA debe implementarse con protocolos éticos, sobre todo al tratar documentos con información sensible.
  • Formación del personal: Es clave ofrecer formación básica en IA para el equipo archivístico.
  • Calidad de los datos: Cuanto mejor estructurado esté el archivo, más eficiente será la aplicación de la IA.


Aplicaciones prácticas en un archivo universitario

La IA no sólo transforma los archivos como institución, sino también la forma en que trabaja el propio archivista

EL uso de asistentes personales como ChatGPT, Claude o Copilot pueden ayudar a la redacción de informes, elaborar textos para exposiciones virtuales o generar borradores de instrumentos de descripción archivística.

Para trabajar con documentos multilingües, la realización de resúmenes o traducir catálogos, manuales o documentos de trabajo, el uso de aplicaciones de traducción automática mejorada como DeepL, o Google Translate + revisión, serían opciones muy acertadas.

Recordemos que hoy en día la aplicación del reconocimiento óptico de caracteres (OCR) es normal y que nos ayuda a buscar en documentos escaneados. Y eso, es una aplicación/solución inteligente. Una solución que nos facilita enormemente el acceso a la información.

Como he mencionado arriba, a la hora de trabajar con fondos históricos digitalizados, la integración de plataformas como Transkribus, no sólo nos ayuda a la transcripción, sino también a la generación de índices temáticos automáticamente.

También nos ahorraría tiempo y trabajo en tareas repetitivas, en las que únicamente el personal archivero, comprobaría y supervisaría que todo fuese correcto, como: 

Creación masiva de metadatos a partir de plantillas y extracción automática con herramientas como Python, OpenRefine o scripts conectados a OCRs.

Detección de errores o inconsistencias en bases de datos documentales gracias a modelos entrenados para revisar estructuras de metadatos.

En cuanto a la visualización de datos archivísticos: utilizar  Power BI, Tableau o Flourish para generar mapas cronológicos, árboles jerárquicos o diagramas de flujo que faciliten la consulta o análisis de fondos documentales complejos.

Imagen creada por IA

Si hablamos del análisis y minería de texto (Text Mining), existen herramientas como Voyant Tools, spaCy o Gensim que permiten analizar grandes volúmenes de texto para identificar temas recurrentes, extraer nombres propios, fechas o lugares, detectar relaciones entre documentos (útil en fondos de investigación).

Existen otras herramientas/aplicaciones enfocadas a la curación de contenidos y vigilancia tecnológica: Configurar alertas y resúmenes automáticos con herramientas como Feedly + Leo (IA) o Perplexity AI para mantenerte actualizado sobre nuevas normativas, herramientas y tendencias en archivística.





(*) La visión artificial (también conocida como visión por computador) es un campo de la inteligencia artificial que permite a los ordenadores "ver" e interpretar imágenes y videos de manera similar a como lo hacen los humanos. Esta tecnología utiliza algoritmos y modelos de aprendizaje automático para analizar datos visuales, identificar patrones y tomar decisiones basadas en la información visual.

No hay comentarios:

Publicar un comentario