O projeto llama.cpp lançou a versão b9858, que inclui uma alteração para usar o split principal do Hugging Face como o caminho do modelo. Esta atualização resolve a issue #25181 referente aos caminhos de carregamento de modelos.
- Binários para macOS Apple Silicon (arm64) e Intel (x64) estão disponíveis.
- Um XCFramework para iOS está incluído para implantação móvel.
- As compilações para Linux suportam Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO e SYCL FP32/FP16.
- Binários para Android arm64 (CPU) são fornecidos.
- As compilações para Windows cobrem CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL e HIP.
- Compilações do openEuler para x86 e aarch64 com suporte a ACL Graph estão listadas, embora algumas configurações estejam desabilitadas.
Este lançamento fornece binários atualizados para uma ampla gama de arquiteturas de hardware e sistemas operacionais, garantindo compatibilidade com os padrões mais recentes de carregamento de modelos.