Un guide open-source, bilingue en anglais et en espagnol, détaillant le fonctionnement interne des Transformers a été publié. La ressource couvre les mathématiques exactes et les mécanismes derrière l'effondrement de l'attention et la compression du KV-cache.

Le guide fournit une explication visuelle étape par étape à partir de zéro et inclut du code reproductible. Il est lié au projet TAF Agent de l'auteur pour des tests pratiques et est disponible sur karlesmarin.github.io/transformers-guide.