Gemma 4 E2B достигает скорости 255 токенов в секунду в браузере на устройстве M4 Max с использованием ядер WebGPU. Демо и ядра теперь доступны на Hugging Face для публичного использования.
Gemma 4 E2B работает со скоростью 255 токенов в секунду в браузере с использованием WebGPU
Переведено с English → Русский