Автор предлагает кросс-доменный слепой визуальный эксперимент, чтобы определить, может ли большая языковая модель сжать свое процедурное планирование в переиспользуемый каркас, который улучшает вывод малой модели без дообучения. Используя Three.js в качестве тестовой среды, исследование направлено на доказательство того, что этот перенос навыков является подлинным, а не просто переобучением на исходном домене.
- Базовый уровень сравнивает выводы большой модели (Модель A) и малой модели с 9 млрд параметров (Модель B) по двум различным промптам: кинематографичная сцена с Майклом Джексоном и другими фигурами, а также низкополигональная башня BMPT-72.
- Гипотеза предполагает, что Модель A может извлечь «Процедурный каркас», содержащий общие принципы построения, а не конкретные ответы на исходный промпт.
- Валидация включает применение этого каркаса к Модели B для второй задачи и использование нового экземпляра большой модели (Модель C) в качестве слепого судьи с нулевым контекстом об эксперименте.
- Модель C количественно оценивает рендеринговые изображения по визуальному качеству, распознаванию силуэта, структурной целостности и плотности деталей, чтобы определить, улучшает ли вывод малой модели с каркасом результат относительно базового уровня большой модели.
Эта настройка предназначена для того, чтобы служить парадигмой доказательства обобщения навыков после обучения, демонстрируя, что процедурные знания могут быть перенесены между семантически различными доменами в рамках одной платформы.