media r/LocalLLaMA · hace 1 h · fuente: hace 6 d · open_models

GLM-5.2 supera a Gemini y GPT-5.4 en programación, pero es ineficiente

Traducido del English → Español

GLM-5.2 supera a GPT-5.4 y a toda la línea de Gemini en rendimiento de codificación en el benchmark DeepSWE. Sin embargo, requiere significativamente más tokens de salida, lo que lo hace sustancialmente menos eficiente en términos de costo por tarea en comparación con modelos como GPT-5.5 y Claude Opus 4.8.

Importancia 2/3 Supera un benchmark de un laboratorio puntero r/LocalLLaMA Zhipu AI Mistral AI OpenAI Code generation Evaluation & benchmarks Open weights

Benchmarks

Benchmark	Modelo	Puntuación
SWE-bench Verified	GLM-5.2	0%

Leer original