O lançamento llama.cpp b9817 atualiza o backend do OpenVINO para a versão 2026.2.1 e torna seus pacotes de lançamento autossuficientes. Esta atualização inclui várias melhorias de operadores dentro do backend do OpenVINO, como a remoção dos conjos hardcoded compute_op_type e a habilitação do softmax com entrada sink.

  • Atualização para o OpenVINO 2026.2.1 com pacotes de lançamento autossuficientes.
  • Remoção dos conjos hardcoded compute_op_type no backend do OpenVINO.
  • Habilitação do suporte ao softmax com entrada sink.
  • Otimização do processo de conversão mul_mat_id para grandes tamanhos.
  • Modificação do add_id para suportar entradas 2D/4D.
  • Adição de suporte ao operador glu_swiglu_oai.

O lançamento fornece binários pré-compilados para macOS (Apple Silicon e Intel), iOS, Linux (Ubuntu x64, arm64, s390x), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) e openEuler em várias arquiteturas de CPU.