Docker: Construir a interface do usuário (#24794)
O projeto Docker adicionou suporte para construir o componente da interface do usuário. Esta atualização também inclui o uso do APP_VERSION existente na configuração do contêiner.
O projeto Docker adicionou suporte para construir o componente da interface do usuário. Esta atualização também inclui o uso do APP_VERSION existente na configuração do contêiner.
A versão b9724 do llama.cpp inclui várias correções de bugs e melhorias, como correções de compilação, prevenção de estouro na função area() e uma verificação de sanidade em get_u32(). O lançamento fornece binários pré-compilados para macOS (arm64 e x64), Linux (x64, arm64, s390x, Vulkan, ROCm, OpenVINO, SYCL), Android (arm64), Windows (x64, arm64, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) e openEuler (x86 e aarch64 com suporte a ACL Graph), além de um pacote de UI.
A versão b9723 do llama.cpp introduz suporte para os modelos Qwen3.5 e Qwen3.6 por meio do Eagle3. O lançamento inclui restauração adiada de checkpoints de fronteira para modelos híbridos e atualizações nas convenções de API e nomenclatura. Builds binários estão disponíveis para as plataformas macOS, Linux, Android, Windows e openEuler, com opções para CPU, Vulkan, OpenVINO, SYCL e ROCm.
A versão b9722 do LLaMA.cpp corrige um problema de valor n_discard não vinculado no tratamento do contexto do servidor. O lançamento inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e frameworks de aceleração como Vulkan, CUDA, OpenVINO e SYCL.
A versão b9718 do llama.cpp consolida a seleção de slots em uma única função, get_available_slot, mantendo as verificações de similaridade LCP para atualizações do cache de prompts. O release inclui builds binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware.
O llama.cpp lançou a versão b9721, oferecendo binários para macOS, Linux, Android, Windows e openEuler em várias arquiteturas. O lançamento inclui suporte a CPU, Vulkan, ROCm, OpenVINO, SYCL e HIP, com um pacote de UI dedicado. Um recurso para Apple Silicon com KleidiAI está atualmente desabilitado.
O ggml-cpu agora suporta K tails na multiplicação de matrizes MMA Q8/Q4 do Power10, removendo o requisito de que K seja divisível por kc. Isso permite que mais cargas de trabalho usem o kernel MMA e reduz a dependência do mnpack.
O lançamento da v0.17.6 adiciona guardrails de entrada para ferramentas com pré-aprovação e dados personalizados apenas para SDK para saídas de ferramentas. Ele também impõe um contrato estritamente compatível com JSON para saídas de ferramentas e suprime avisos desnecessários de espaços em branco nos nomes das ferramentas. @siddiksawani fez sua primeira contribuição neste lançamento.
A versão b9716 do llama.cpp introduz suporte a processamento em lote para o InternVL, melhorando o desempenho do modelo por meio de processamento eficiente em lotes. O lançamento inclui builds binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, OpenVINO, SYCL e ROCm.
O llama.cpp lançou a versão b9713, adicionando suporte a batching ao mtmd-cli e testes de vídeo. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.
A versão b9714 do llama.cpp adiciona o cabeçalho "X-Accel-Buffering": "no" aos endpoints de streaming para evitar que o Nginx armazene as respostas em buffer, resolvendo problemas de streaming com aplicativos como a ferramenta de codificação Pi. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler, abrangendo múltiplas arquiteturas e opções de aceleração por hardware.
A versão b9715 do LLaMA.cpp introduz suporte a CUDA para GGML_OP_COL2IM_1D, construindo sobre uma implementação em CPU. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e frameworks de aceleração, incluindo Vulkan, ROCm, OpenVINO e SYCL.
O v1.14.8a2 adiciona uma única ação de agente às definições de Flow e valida expressões CEL no momento do carregamento. Inclui um novo guia de integração com o Datadog, com um painel de operações importável, além das capturas de tela e do registro de alterações atualizados para o v1.14.8a1.
O llama.cpp lançou a versão b9711 com binários atualizados para macOS, Linux, Android, Windows e openEuler. A versão inclui suporte para ARM64, x64, Vulkan, ROCm, OpenVINO, SYCL e HIP, com binários dedicados para aceleração de CPU e GPU. Um novo pacote de UI também está disponível.
A versão b9712 do llama.cpp inclui uma correção para problemas de build da UI causados por arquivos de origem somente leitura. O lançamento fornece binários pré-compilados para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.
A v2.1.183 melhora a segurança do modo automático bloqueando comandos git e destroy destrutivos sem consentimento explícito do usuário. Adiciona avisos de descontinuação para modelos, introduz attribution.sessionUrl para ocultar links de sessão e corrige vários problemas, incluindo comportamento do terminal, desempenho do subagente e manipulação de entrada em ambientes web e tmux.
A versão b9707 do llama.cpp introduz validação de esquema e melhorias nas mensagens de erro. Inclui builds binários para macOS, Linux, Android, Windows e openEuler em várias arquiteturas e opções de aceleração de hardware.
LangGraph lança versão 1.2.6, corrigindo uma regressão em que subgrafos aninhados herdavam incorretamente o checkpoint_ns do pai. A atualização também melhora o cancelamento de subgrafos em execução durante abortos de stream e inclui uma atualização da versão da CLI para 0.4.30.
A versão 1.14.8a1 adiciona uma expressão if opcional às etapas each.do e corrige problemas do JSON crew. O snapshot e o changelog da v1.14.8a foram atualizados. Os contribuidores incluem @joaomdmoura e @vinibrsl.
A versão b9703 do llama.cpp inclui uma reformulação do tratamento de presets do servidor, removendo o suporte a presets remotos da HF e funções obsoletas. O lançamento fornece binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.