media r/LocalLLaMA · 7 д назад · open_models

У кого есть достаточно вычислительных ресурсов, чтобы создать дистилляционный датасет из GLM5.2?

Переведено с English → Русский

Пользователь спрашивает, у кого есть достаточные вычислительные ресурсы, чтобы создать большой дистилляционный датасет из 700 000 до 1 миллиона примеров из GLM5.2. Цель — улучшить обучение более маленьких моделей, таких как Qwen3.5, и помочь более широкой сообществу.

Важность 2/3 r/LocalLLaMA Zhipu AI Alibaba (Qwen) Open weights Training data Training methods

Оригинал