Mission : Construire un système RAG pour une langue parlée menacée

Une offre d'emploi recherche un ingénieur NLP ou LLM expérimenté pour développer le premier moteur de localisation par Génération Augmentée par Récupération (RAG) pour une langue à faible ressource parlée en Amérique du Sud. Le projet utilise un corpus propriétaire de contenu pédagogique et de données de dictionnaire développé sur quatre ans.

Développer un pipeline RAG utilisant LangChain ou LlamaIndex avec des embeddings multilingual-e5.
Implémenter des solutions de base de données vectorielles (Pinecone, Weaviate ou Supabase pgvector) avec une latence inférieure à 500 ms.
Créer une couche de prompts modulaire supportant six modèles d'utilisation incluant la traduction et la localisation.
Construire une infrastructure B2B SaaS multi-locataire avec une isolation stricte des données, l'authentification JWT et des quotas configurables.
Livrer une API REST avec documentation Swagger, une interface d'administration pour la gestion du glossaire et un bundle SQLite hors ligne pour React Native.

Le poste nécessite le transfert complet de la propriété intellectuelle au client et est budgétisé entre 5 000 et 10 000 € pour une durée de 10 semaines.