En este taller aprenderemos a implementar técnicamente un sistema de Generación Aumentada por Recuperación (RAG) integrando n8n, Google Drive y PostgreSQL. Abordaremos cómo configurar un entorno donde los documentos almacenados en la nube puedan ser procesados y consultados de manera eficiente. Se destaca la importancia de que los usuarios gestionen sus propios archivos y carpetas para garantizar el acceso correcto a la información durante la automatización.
Como parte fundamental de la sesión, configuraremos la base de datos PostgreSQL utilizando la extensión PGVector. Esta herramienta permite el almacenamiento y manejo de vectores, fundamentales para las búsquedas semánticas dentro del sistema RAG. Veremos cómo actualizar la imagen de la base de datos mediante Docker y cómo activar la función de vectores ejecutando comandos específicos de SQL para asegurar que la infraestructura soporte el procesamiento de datos complejos.
Durante la práctica, seguiremos el flujo de trabajo para cargar archivos, como manuales corporativos en formato PDF, a través de un formulario. Aprenderemos la necesidad de transformar estos archivos en datos binarios para que n8n pueda procesarlos correctamente y almacenarlos en la base de datos. En este taller se enfatiza que no basta con guardar metadatos en formato JSON, sino que debemos asegurar la integridad del contenido del documento para que el sistema de inteligencia artificial pueda consultarlo posteriormente.
Finalmente, cubriremos la gestión y depuración de la base de datos, conectando herramientas externas para visualizar y administrar las tablas. Aprenderemos a limpiar información previa mediante el comando “truncate” y a verificar que los datos se estén indexando correctamente. El objetivo es que los participantes comprendan tanto la arquitectura del servidor como la lógica de conexión necesaria para construir un sistema de conocimiento dinámico y funcional.
