El decodificador MiniMax M3 EAGLE3 ha sido convertido al formato GGUF y ahora es compatible con llama.cpp. Las pruebas en un sistema de 2x3090, 128GB con cuantización UD-Q2_K_XL mostraron que el rendimiento mejoró de 2.3 a 5 tokens por segundo usando --fit y manteniendo el modelo en VRAM.