media r/LocalLLaMA · hace 1 h · fuente: hace 8 d · open_models

EvoTensile: Ajuste evolutivo de núcleos GEMM de AMD Tensile

Traducido del English → Español

EvoTensile utiliza algoritmos evolutivos para ajustar núcleos GEMM para GPUs AMD, mejorando el rendimiento del layout NT de 20 a 40 TFLOPS en Strix Halo. Esta aceleración representa un avance significativo respecto a los núcleos no optimizados, aunque sigue por debajo de la línea de techo teórica de 59.4 TFLOPS.

Importancia 1/3 r/LocalLLaMA Evaluation & benchmarks Hardware & chips Training methods

Leer original