Un usuario probó la versión de 4 bits de GLM-5.2 (GLM-5.2-UD-Q4_K_XL) en un servidor equipado con un procesador Epyc Rome 7452 y 512GB de RAM. El modelo fue evaluado utilizando un prompt de codificación complejo que requería la creación de un juego de arena 3D autocontenido en HTML, CSS y JavaScript.

  • Hardware: CPU AMD Epyc Rome 7452 con 512GB de RAM.
  • Modelo: GLM-5.2-UD-Q4_K_XL (cuantización de 4 bits).
  • Tarea: Generar un único archivo .html para un juego 3D usando Three.js, incluyendo movimiento del jugador, coleccionables, enemigos y HUD.
  • Salida: El modelo generó 15,510 tokens durante un período de 2 horas y 29 minutos.
  • Calidad: El autor señaló su sorpresa ante la alta calidad del código generado.

La prueba demuestra que los modelos de lenguaje grandes pueden realizar tareas complejas de razonamiento y generación de código en hardware solo con CPU dada suficiente memoria.