Gemma 4 E2B alcanza 255 tokens por segundo en el navegador en un M4 Max utilizando kernels de WebGPU. La demostración y los kernels ya están disponibles en Hugging Face para uso público.
Gemma 4 E2B se ejecuta a 255 tok/s en el navegador usando WebGPU
Traducido del English → Español