Text-to-SQL em Data Warehouse de 1.200 Tabelas
Resposta em 2 dias → segundos
Contexto do Cliente
Uma empresa de serviços financeiros com um data warehouse de 1.200 tabelas contendo 8 anos de dados de transacções, clientes e operações. Os utilizadores de negócio dependem de uma pequena equipa de análise para cada pedido de dados.
O Desafio
Os analistas têm um prazo de resposta de 2 dias nos pedidos de dados. Os utilizadores de negócio não conseguem aceder aos seus próprios dados sem conhecimentos de SQL. A equipa de análise é um estrangulamento, e quando as respostas chegam, as questões muitas vezes já mudaram.
A Nossa Abordagem
Construímos um pipeline Text-to-SQL com um catálogo semântico de esquemas que vectoriza cada descrição de tabela e coluna no Qdrant usando embeddings BGE-M3. Quando um utilizador faz uma pergunta, o sistema primeiro identifica as tabelas relevantes, depois gera SQL preciso, valida-o e devolve resultados em linguagem natural com a consulta subjacente visível.
Prazo: 14 semanas
Os Resultados
- Consultas que exigem 2 dias de analista respondem em segundos
- Projecção: utilizadores de negócio respondem autonomamente a 70% dos pedidos de dados
- Equipa de análise libertada para análise complexa e desenvolvimento de modelos
- 1.200 tabelas catalogadas com descrições semânticas
Casos de uso relacionados
Enfrenta um desafio semelhante?
Vamos conversar sobre como podemos ajudar a sua organização a alcançar resultados semelhantes.