Ручной эксперимент проверил, может ли процедурный каркас, сгенерированный большой моделью, передать дисциплину планирования меньшим моделям без дообучения или раскрытия целевого ответа. Результаты показывают, что этот подход значительно улучшает структурную читаемость и композицию в малых моделях при применении к различным доменам Three.js.
- Тест сравнивал выходные данные DeepSeek V4 Pro, Qwen 27B и квантованной модели 35B A3 на задачах хореографии персонажей и механических турелей.
- Для более крупной модели DeepSeek V4 Pro каркас обеспечил незначительное улучшение освещения и художественного направления, но оказал ограниченное влияние на структуру.
- Малые модели (Qwen 27B и 35B Q3_K_M) показали значительные улучшения в иерархии сцены, разделении объектов и четкости силуэтов, при этом каркас не создавал шаблонных или запутанных результатов.
- Переданные навыки представляли собой абстрактные шаги планирования, такие как определение контрактов сцены, построение по слоям и аудит итогового вывода, а не копирование конкретных деталей домена.
Автор делает вывод, что большие модели могут выносить часть своей внутренней дисциплины планирования в переиспользуемую структуру во время вывода, помогая меньшим моделям более надежно организовывать свои существующие знания.