Пользователь спрашивает, у кого есть достаточные вычислительные ресурсы, чтобы создать большой дистилляционный датасет из 700 000 до 1 миллиона примеров из GLM5.2. Цель — улучшить обучение более маленьких моделей, таких как Qwen3.5, и помочь более широкой сообществу.
У кого есть достаточно вычислительных ресурсов, чтобы создать дистилляционный датасет из GLM5.2?
Переведено с English → Русский