Misión: Construir un sistema RAG para lengua hablada en peligro de extinción

Una oferta de empleo busca un ingeniero experimentado en NLP o LLM para desarrollar el primer motor de localización basado en Generación Aumentada por Recuperación (RAG) para una lengua de bajos recursos hablada en Sudamérica. El proyecto utiliza un corpus propietario de contenido pedagógico y datos de diccionario desarrollado durante cuatro años.

Desarrollar un pipeline RAG usando LangChain o LlamaIndex con embeddings multilingües-e5.
Implementar soluciones de bases de datos vectoriales (Pinecone, Weaviate o Supabase pgvector) con latencia inferior a 500ms.
Crear una capa de prompts modular que soporte seis plantillas de casos de uso, incluyendo traducción y localización.
Construir infraestructura B2B SaaS multiinquilino con aislamiento estricto de datos, autenticación JWT y cuotas configurables.
Entregar API REST con documentación Swagger, una interfaz de administración para gestión de glosarios y un paquete SQLite offline para React Native.

El rol requiere la transferencia completa de la propiedad intelectual al cliente y está presupuestado entre 5.000–10.000€ para una duración de 10 semanas.