Обновление: Первые ручные результаты тестирования переноса процедурных навыков в малых моделях

Ручной эксперимент проверил, может ли процедурный каркас, сгенерированный большой моделью, передать дисциплину планирования меньшим моделям без дообучения или раскрытия целевого ответа. Результаты показывают, что этот подход значительно улучшает структурную читаемость и композицию в малых моделях при применении к различным доменам Three.js.

Тест сравнивал выходные данные DeepSeek V4 Pro, Qwen 27B и квантованной модели 35B A3 на задачах хореографии персонажей и механических турелей.
Для более крупной модели DeepSeek V4 Pro каркас обеспечил незначительное улучшение освещения и художественного направления, но оказал ограниченное влияние на структуру.
Малые модели (Qwen 27B и 35B Q3_K_M) показали значительные улучшения в иерархии сцены, разделении объектов и четкости силуэтов, при этом каркас не создавал шаблонных или запутанных результатов.
Переданные навыки представляли собой абстрактные шаги планирования, такие как определение контрактов сцены, построение по слоям и аудит итогового вывода, а не копирование конкретных деталей домена.

Автор делает вывод, что большие модели могут выносить часть своей внутренней дисциплины планирования в переиспользуемую структуру во время вывода, помогая меньшим моделям более надежно организовывать свои существующие знания.