تبحث وظيفة عن مهندس NLP أو LLM ذو خبرة لتطوير محرك التعريب الأول القائم على التوليد المعزز بالاسترجاع (RAG) للغة منخفضة الموارد المستخدمة في أمريكا الجنوبية. يستخدم المشروع مجموعة بيانات خاصة بمحتوى تربوي وبيانات قاموس تم تطويرها على مدى أربع سنوات.

  • تطوير خط أنابيب RAG باستخدام LangChain أو LlamaIndex مع تضمينات multilingual-e5.
  • تنفيذ حلول قواعد البيانات المتجهة (Pinecone، Weaviate، أو Supabase pgvector) بزمن استجابة أقل من 500 مللي ثانية.
  • إنشاء طبقة أوامر مرنة تدعم ستة قوالب لحالات الاستخدام تشمل الترجمة والتعريب.
  • بناء بنية SaaS متعددة المستأجرين مع عزل صارم للبيانات، ومصادقة JWT، وحصص قابلة للتكوين.
  • تسليم واجهة برمجة تطبيقات REST مع توثيق Swagger، وواجهة إدارة لإدارة المفردات، وحزمة SQLite غير متصلة لـ React Native.

يتطلب الدور نقلًا كاملاً لحقوق الملكية الفكرية إلى العميل وهو ممول بميزانية تتراوح بين 5,000–10,000 يورو لمدة 10 أسابيع.