Вакансия ищет опытного инженера по NLP или LLM для разработки первого движка локализации на основе Retrieval-Augmented Generation (RAG) для малообеспеченного языка, на котором говорят в Южной Америке. Проект использует проприетарный корпус педагогического контента и словарных данных, разработанный за четыре года.

  • Разработать пайплайн RAG с использованием LangChain или LlamaIndex и многоязычными эмбеддингами multilingual-e5.
  • Реализовать решения для векторной базы данных (Pinecone, Weaviate или Supabase pgvector) с задержкой менее 500 мс.
  • Создать модульный слой промптов, поддерживающий шесть шаблонов использования, включая перевод и локализацию.
  • Построить многопользовательскую инфраструктуру B2B SaaS со строгой изоляцией данных, аутентификацией JWT и настраиваемыми квотами.
  • Предоставить REST API с документацией Swagger, интерфейс администратора для управления глоссарием и офлайн-пакет SQLite для React Native.

Требования к роли включают полный перевод прав интеллектуальной собственности клиенту; бюджет составляет от 5000 до 10000€ на срок 10 недель.