Benchmark inicial de Minimax M3 (4-bit MLX) en Mac Studio M3 con 512GB
Se realizó un benchmark de Minimax M3 (4-bit MLX) en un Mac Studio M3 con 512GB de almacenamiento. Los resultados muestran métricas de rendimiento de tokens y latencia para diferentes tamaños de prompt, con un rendimiento máximo de 269.1 tok/s para prompts de 8192 tokens y 172.8 tok/s para un prompt de 65k tokens, utilizando 228GB de memoria en su punto máximo.