Transformer的全面双语指南：从基础到KV缓存压缩与注意力动态

Carles Marin发布了一份开源的双语（英语和西班牙语）指南，将Transformer架构的数学基础与其实际实现联系起来。该资源侧重于底层机制，提供可复现的代码和交互式元素来解释复杂主题。

该指南旨在作为理解Transformer内部机制的全面教育资源，作者邀请社区就注意力状态可视化和优化技术提供反馈。