Предложение по созданию краудсорсинговых, открытых дистиллированных LLM через распределённое обучение

Пользователь Reddit предлагает систему для создания по-настоящему открытых дистиллированных больших языковых моделей путём обёртывания существующих сервисов ИИ с командной строкой. Этот подход позволит собирать пользовательские входные и выходные данные из таких приложений, как помощники по написанию кода или чат-боты, формируя огромные наборы данных за счёт участия добровольцев.

В предложении предлагается распределить фазу обучения модели между GPU геймеров, что обеспечит более медленное, но масштабируемое вычисление. Признаётся, что создание доверенного центрального органа для координации и публикации данных является основной проблемой, хотя начало работы с меньшими моделями может помочь постепенно наладить доверие.

Автор отмечает, что, несмотря на необходимость значительной инфраструктуры и координации, эта концепция предлагает потенциальный путь для развития моделей силами сообщества при условии мобилизации достаточного числа добровольцев.