media r/LocalLLaMA · hace 1 h · fuente: hace 8 d · open_models

GLM-5.2 ahora puede ejecutarse localmente en llama.cpp y Unsloth Studio

Traducido del English → Español

GLM-5.2, el modelo abierto más potente hasta la fecha, ahora puede ejecutarse localmente usando llama.cpp y Unsloth Studio. El modelo cuantizado a 2 bits conserva ~82% de precisión tras reducir su tamaño de 1.51TB a 238GB, una reducción del 84%, y es compatible con configuraciones de 256GB de RAM o VRAM.

Importancia 2/3 r/LocalLLaMA Zhipu AI Inference efficiency Open weights

Leer original