कार्लेस मारिन ने एक ओपन-सोर्स, द्विभाषी (अंग्रेजी और स्पैनिश) मार्गदर्शिका जारी की है जो ट्रांसफॉर्मर आर्किटेक्चर के गणितीय आधार को उनके व्यावहारिक कार्यान्वयन से जोड़ती है। संसाधन निचले स्तर की यांत्रिकी पर केंद्रित है, जटिल विषयों को समझाने के लिए पुनरुत्पादक कोड और इंटरैक्टिव तत्व प्रदान करता है।

  • ध्यान गतिशीलता: ध्यान के पतन की शून्य से कार्यान्वयन और विश्लेषण कवर करता है।
  • संदर्भ और मेमोरी: KV-cache संपीड़न तकनीकों और लंबे-संदर्भ विंडो से जुड़ी चुनौतियों का पता लगाता है।
  • उन्नत अवधारणाएं: ग्रॉकिंग, अनुकूलन रणनीतियों और संरचनात्मक विश्लेषण की व्याख्याएं शामिल हैं।
  • इंटरैक्टिव टूल्स: सैद्धांतिक व्याख्याओं के साथ ब्राउज़र-आधारित LLM परीक्षण के लिए TAF एजेंट फ्रेमवर्क प्रस्तुत करता है।

मार्गदर्शिका का उद्देश्य ट्रांसफॉर्मर इंटरनल्स को समझने के लिए एक व्यापक शैक्षिक संसाधन के रूप में कार्य करना है, जिसमें लेखर ध्यान स्थिति विज़ुअलाइजेशन और अनुकूलन तकनीकों पर सामुदायिक प्रतिक्रिया आमंत्रित करते हैं।