DiffusionGemma имеет плохую прозрачность переменных из-за высокой степени прозрачности последовательности, но это может быть уменьшено за счёт интерпретируемого барьера токенов, снижая глубину последовательности до 1,1 раза глубины Gemma 4. Алгоритмическая прозрачность в моделях диффузии является более сложной из-за динамических предсказаний токенов, с ранними доказательствами нехронологического мышления, размытия токенов и мышления в промежуточном контексте. DiffusionGemma показан как сопоставимо прозрачный по сравнению с Gemma 4.
На сколько прозрачна DiffusionGemma?
Переведено с English → Русский