llama.cpp gfx900 GPUs पर घन प्रीफिल के लिए hipBLAS का उपयोग करता है

llama.cpp रिपॉजिटरी में एक पुल अनुरोध एक परिवर्तन पेश करता है जो AMD gfx900 आर्किटेक्चर वाली GPUs पर घन प्रीफिल ऑपरेशन के लिए hipBLAS का उपयोग करता है। यह संशोधन विशेष रूप से विरासत Vega GPU हार्डवेयर, जैसे कि Radeon RX Vega 56/64 और Radeon Pro Vega श्रृंखला सहित मॉडलों, को लक्षित करता है।

परीक्षण किए गए मॉडलों में औसतन लगभग 40% की प्रदर्शन वृद्धि।
Qwen3.5 4B में प्रदर्शन में 36.1% की वृद्धि देखी गई।
Qwen3.6 27B में 18.9% की सुधार दिखाई देता है।
Gemma4 12B ने 65.1% का महत्वपूर्ण बढ़ावा हासिल किया।

यह अपडेट पुराने AMD Vega हार्डवेयर चला रहे उपयोगकर्ताओं के लिए महत्वपूर्ण गति सुधार प्रदान करता है, इस विशिष्ट आर्किटेक्चर पर प्रदर्शन सीमाओं को दूर करता है।