media r/LocalLLaMA · hace 2 h · fuente: hace 4 d · open_models

El modelo GGUF MiniMax M3 EAGLE3 ahora es compatible con llama.cpp

Traducido del English → Español

El decodificador MiniMax M3 EAGLE3 ha sido convertido al formato GGUF y ahora es compatible con llama.cpp. Las pruebas en un sistema de 2x3090, 128GB con cuantización UD-Q2_K_XL mostraron que el rendimiento mejoró de 2.3 a 5 tokens por segundo usando --fit y manteniendo el modelo en VRAM.

Importancia 1/3 r/LocalLLaMA Code generation Open weights

Leer original