Missão: Construir Sistema RAG para Língua Oral em Extinção

Uma vaga de emprego busca um engenheiro experiente em NLP ou LLM para desenvolver o primeiro motor de localização baseado em Geração Aumentada por Recuperação (RAG) para uma língua de baixo recurso falada na América do Sul. O projeto utiliza um corpus proprietário de conteúdo pedagógico e dados de dicionário desenvolvidos ao longo de quatro anos.

Desenvolver um pipeline RAG usando LangChain ou LlamaIndex com embeddings multilingual-e5.
Implementar soluções de banco de dados vetoriais (Pinecone, Weaviate ou Supabase pgvector) com latência inferior a 500ms.
Criar uma camada de prompt modular que suporte seis modelos de casos de uso, incluindo tradução e localização.
Construir infraestrutura B2B SaaS multi-tenant com isolamento rigoroso de dados, autenticação JWT e cotas configuráveis.
Entregar API REST com documentação Swagger, interface administrativa para gerenciamento de glossário e pacote SQLite offline para React Native.

O cargo requer a transferência total da propriedade intelectual ao cliente e está orçado entre 5.000–10.000€ por uma duração de 10 semanas.