Uma vaga de emprego busca um engenheiro experiente em NLP ou LLM para desenvolver o primeiro motor de localização baseado em Geração Aumentada por Recuperação (RAG) para uma língua de baixo recurso falada na América do Sul. O projeto utiliza um corpus proprietário de conteúdo pedagógico e dados de dicionário desenvolvidos ao longo de quatro anos.
- Desenvolver um pipeline RAG usando LangChain ou LlamaIndex com embeddings multilingual-e5.
- Implementar soluções de banco de dados vetoriais (Pinecone, Weaviate ou Supabase pgvector) com latência inferior a 500ms.
- Criar uma camada de prompt modular que suporte seis modelos de casos de uso, incluindo tradução e localização.
- Construir infraestrutura B2B SaaS multi-tenant com isolamento rigoroso de dados, autenticação JWT e cotas configuráveis.
- Entregar API REST com documentação Swagger, interface administrativa para gerenciamento de glossário e pacote SQLite offline para React Native.
O cargo requer a transferência total da propriedade intelectual ao cliente e está orçado entre 5.000–10.000€ por uma duração de 10 semanas.