Ir al contenido principal
Todos los casos de uso

Text-to-SQL sobre un Almacén de Datos con 1.200 Tablas

Espera de 2 días → segundos

Contexto del Cliente

Una empresa de servicios financieros con un almacén de datos de 1.200 tablas que contiene 8 años de datos de transacciones, clientes y operaciones. Los usuarios de negocio dependían de un pequeño equipo de analítica para cada solicitud de datos.

El Desafío

Los analistas tenían un plazo de respuesta de 2 días en las solicitudes de datos. Los usuarios de negocio no podían acceder a sus propios datos sin conocimientos de SQL. El equipo de analítica era un cuello de botella y, cuando llegaban las respuestas, las preguntas a menudo habían cambiado.

Nuestro Enfoque

Construimos un pipeline Text-to-SQL con un catálogo semántico de esquemas que vectoriza cada descripción de tabla y columna en Qdrant utilizando embeddings BGE-M3. Cuando un usuario formula una pregunta, el sistema primero identifica las tablas relevantes, luego genera SQL preciso, lo valida y devuelve los resultados en lenguaje natural con la consulta subyacente visible.

Plazo: 14 semanas

Los Resultados

  • Las consultas que requerían 2 días de espera del analista ahora se resuelven en segundos
  • Los usuarios de negocio se autoabastecen del 70% de las solicitudes de datos
  • El equipo de analítica liberado para análisis complejos y desarrollo de modelos
  • 1.200 tablas catalogadas con descripciones semánticas

¿Enfrenta un desafío similar?

Hablemos sobre cómo podemos ayudar a su organización a alcanzar resultados similares.