GLM-5.2 ha sido evaluado en el benchmark DeepSWE, con el rendimiento destacado en la esquina superior derecha de la visualización. La publicación señala que las puntuaciones disminuyen a medida que aumenta el precio, y remite al sitio web de DeepSWE y ArtificialAnalysis para evaluaciones alternativas, mientras aborda críticas y contexto histórico sobre la validez del benchmark.
GLM-5.2 lanzado en el benchmark DeepSWE
Traducido del English → Español