Эксперимент по сравнению поставил Claude Code на базе Opus 4.8 против локально запущенной модели Qwen3.6 27B для создания движка воксельного мира на чистом C без внешних фреймворков или библиотек.

  • Локальная модель Qwen3.6 27B была запущена через vLLM с использованием квантования NVFP4 и контекстным окном 256k, достигая примерно 130 TPS на RTX 6000 Blackwell 96GB.
  • Opus 4.8 продемонстрировала превосходное понимание физики вокселей, сохраняя целостность ландшафта, выравнивание чанков и функциональную коллизию.
  • Qwen3.6 27B успешно скомпилировала и отрендерила код, но столкнулась с проблемами управления памятью, вызвавшими визуальные разрывы, несмотря на работу с необработанными указателями и ручным выделением памяти.

Результаты подчеркивают значительное улучшение способности локальных моделей справляться со сложными задачами программирования на C, что указывает на быстрое повышение минимального уровня производительности моделей с открытым весом, даже если модели переднего края остаются впереди.