Теперь доступна модель Gemma4-12B-QAT Uncensored Balanced, обеспечивающая ускорение на 60% за счёт спекулятивного декодирования с предсказанием нескольких токенов (MTP). Включает квантование Q4_K_M, поддержку визуальных данных через mmproj и стабильную генерацию без зацикливания или дрейфа контекста, что делает её идеальной для задач творческого письма и эмоционального интеллекта.