github llama.cpp · hace 1 h · fuente: hace 3 d · inference

la versión b9767 de llama.cpp añade soporte para GPU y multiplataforma

Traducido del English → Español

La versión b9767 de llama.cpp mejora la inferencia MTP utilizando rutas mat-vec para lotes pequeños e incluye soporte actualizado para GPU. La versión proporciona binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y APIs, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

Importancia 1/3 Confianza 2/3 llama.cpp Inference efficiency

Leer original