O projeto llama.cpp lançou a versão b9858, que inclui uma alteração para usar o split principal do Hugging Face como o caminho do modelo. Esta atualização resolve a issue #25181 referente aos caminhos de carregamento de modelos.

  • Binários para macOS Apple Silicon (arm64) e Intel (x64) estão disponíveis.
  • Um XCFramework para iOS está incluído para implantação móvel.
  • As compilações para Linux suportam Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO e SYCL FP32/FP16.
  • Binários para Android arm64 (CPU) são fornecidos.
  • As compilações para Windows cobrem CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL e HIP.
  • Compilações do openEuler para x86 e aarch64 com suporte a ACL Graph estão listadas, embora algumas configurações estejam desabilitadas.

Este lançamento fornece binários atualizados para uma ampla gama de arquiteturas de hardware e sistemas operacionais, garantindo compatibilidade com os padrões mais recentes de carregamento de modelos.