Todos os artigos
github llama.cpp · há 12 d

llama.cpp Lança b9724 com Correções de Bugs e Binários Multiplataforma

A versão b9724 do llama.cpp inclui várias correções de bugs e melhorias, como correções de compilação, prevenção de estouro na função area() e uma verificação de sanidade em get_u32(). O lançamento fornece binários pré-compilados para macOS (arm64 e x64), Linux (x64, arm64, s390x, Vulkan, ROCm, OpenVINO, SYCL), Android (arm64), Windows (x64, arm64, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) e openEuler (x86 e aarch64 com suporte a ACL Graph), além de um pacote de UI.

github llama.cpp · há 12 d

Lançamento do llama.cpp b9723 adiciona suporte para Qwen3.5, Qwen3.6 e Eagle3

A versão b9723 do llama.cpp introduz suporte para os modelos Qwen3.5 e Qwen3.6 por meio do Eagle3. O lançamento inclui restauração adiada de checkpoints de fronteira para modelos híbridos e atualizações nas convenções de API e nomenclatura. Builds binários estão disponíveis para as plataformas macOS, Linux, Android, Windows e openEuler, com opções para CPU, Vulkan, OpenVINO, SYCL e ROCm.