Todos los artículos
github llama.cpp · hace 1 h En vivo

llama.cpp lanza b9690 con operador rope_back y binarios multiplataforma

La versión b9690 de llama.cpp introduce un operador rope_back implementado reutilizando kernels rope existentes con una constante de función para alternar la rotación hacia adelante/hacia atrás. El lanzamiento incluye binarios preconstruidos para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, ROCm, OpenVINO y SYCL.

github llama.cpp · hace 1 h En vivo

LLaMA.cpp Release b9685 Adds SYCL Dev2Dev Memcpy and Multiple Platform Binaries

La versión b9685 de LLaMA.cpp introduce la funcionalidad memcpy dev2dev basada en SYCL, moviendo GGML_SYCL_DEV2DEV_MEMCPY a una tabla en tiempo de ejecución y mejorando la detección de comunicación entre pares. El lanzamiento incluye binarios precompilados para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y APIs incluyendo Vulkan, ROCm, OpenVINO y SYCL (FP32/FP16).