La versión b9678 de LLaMA.cpp incluye la optimización de mul_mat_f16_f32_l4 para la decodificación e introduce nuevas compilaciones para macOS, Linux, Android, Windows y openEuler. La versión ofrece soporte para CPU, Vulkan, ROCm, OpenVINO, SYCL e HIP en múltiples arquitecturas, con un paquete de interfaz de usuario dedicado disponible.
La versión b9678 de LLaMA.cpp añade optimizaciones y compilaciones multiplataforma
Traducido del English → Español