Un usuario probó Qwen3.6-27B (8-bit) junto a GLM5.2 utilizando un harness de codificación que emplea tres críticos—revisión de código, revisión de pruebas y Playwright e2e—para validar la calidad de la salida.
- La tubería de 3-críticos captura eficazmente los errores adicionales inherentes al modelo denso, permitiendo igualar la calidad de salida final de los modelos de frontera.
- Aunque el camino de ejecución es más ruidoso que con modelos más grandes, el harness gestiona la sobrecarga de reintento sin interrumpir el flujo de trabajo.
- La estrategia óptima identificada es usar un modelo de frontera como GLM5.2 para la planificación y Qwen3.6 para la implementación a alto volumen, donde el mecanismo de detección de errores compensa la menor precisión en crudo.