O lançamento b9831 do llama.cpp introduz o suporte ao DFlash v2, incluindo atenção de janela deslizante por tipos de camada, juntamente com um conjunto abrangente de binários pré-compilados para várias plataformas.

  • Estão disponíveis compilações para macOS Apple Silicon (arm64) e Intel (x64), além de um XCFramework para iOS.
  • Os binários para Linux cobrem CPU x64 e arm64 do Ubuntu, CPU s390x, Vulkan, ROCm 7.2, OpenVINO e SYCL FP32/FP16.
  • Estão disponíveis compilações de CPU arm64 para Android em dispositivos móveis.
  • Os lançamentos para Windows incluem variantes para CPU, OpenCL Adreno, CUDA 12.4 e 13.3, Vulkan, OpenVINO, SYCL e HIP.
  • Estão incluídas compilações para openEuler x86 e aarch64 com suporte ao ACL Graph, enquanto as compilações genéricas do macOS KleidiAI e do openEuler estão desabilitadas.

Este lançamento permite que os usuários executem o llama.cpp em uma gama mais ampla de aceleradores de hardware e sistemas operacionais com os novos recursos de otimização DFlash.