Опубликовано двуязычное (на английском и испанском языках) руководство с открытым исходным кодом, подробно описывающее внутреннее устройство трансформеров. Ресурс охватывает точную математику и механику, лежащие в основе коллапса внимания и сжатия KV-кэша.
Руководство предоставляет пошаговое визуальное объяснение с нуля и включает воспроизводимый код. Оно связано с проектом TAF Agent автора для практического тестирования и доступно по адресу karlesmarin.github.io/transformers-guide.