一份详细阐述Transformer内部工作原理的开源双语(英文和西班牙文)指南已发布。该资源涵盖了注意力崩溃和KV缓存压缩背后的精确数学原理与机制。

该指南提供了从零开始的可视化逐步解释,并包含可复现的代码。它与作者的TAF Agent项目相连接,可用于实际测试,访问地址为 karlesmarin.github.io/transformers-guide。