Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 11

llama.cpp release b9718: seleção de slots consolidada e novos builds binários

A versão b9718 do llama.cpp consolida a seleção de slots em uma única função, get_available_slot, mantendo as verificações de similaridade LCP para atualizações do cache de prompts. O release inclui builds binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware.

github llama.cpp · há 12 d

Lançamento do llama.cpp b9721 disponível para múltiplas plataformas

O llama.cpp lançou a versão b9721, oferecendo binários para macOS, Linux, Android, Windows e openEuler em várias arquiteturas. O lançamento inclui suporte a CPU, Vulkan, ROCm, OpenVINO, SYCL e HIP, com um pacote de UI dedicado. Um recurso para Apple Silicon com KleidiAI está atualmente desabilitado.

github llama.cpp · há 12 d

ggml-cpu adiciona suporte a K tails para Power10 MMA Q8/Q4

O ggml-cpu agora suporta K tails na multiplicação de matrizes MMA Q8/Q4 do Power10, removendo o requisito de que K seja divisível por kc. Isso permite que mais cargas de trabalho usem o kernel MMA e reduz a dependência do mnpack.

github OpenAI Agents SDK · há 12 d

Notas de lançamento da v0.17.6

O lançamento da v0.17.6 adiciona guardrails de entrada para ferramentas com pré-aprovação e dados personalizados apenas para SDK para saídas de ferramentas. Ele também impõe um contrato estritamente compatível com JSON para saídas de ferramentas e suprime avisos desnecessários de espaços em branco nos nomes das ferramentas. @siddiksawani fez sua primeira contribuição neste lançamento.

github llama.cpp · há 12 d

Llama.cpp Release b9716 Adiciona Suporte a Lote para InternVL

A versão b9716 do llama.cpp introduz suporte a processamento em lote para o InternVL, melhorando o desempenho do modelo por meio de processamento eficiente em lotes. O lançamento inclui builds binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, OpenVINO, SYCL e ROCm.

github llama.cpp · há 12 d

llama.cpp lança b9713 com novos binários e recursos

O llama.cpp lançou a versão b9713, adicionando suporte a batching ao mtmd-cli e testes de vídeo. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 12 d

Lançamento do llama.cpp b9714 adiciona cabeçalho X-Accel-Buffering e novos binários

A versão b9714 do llama.cpp adiciona o cabeçalho "X-Accel-Buffering": "no" aos endpoints de streaming para evitar que o Nginx armazene as respostas em buffer, resolvendo problemas de streaming com aplicativos como a ferramenta de codificação Pi. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler, abrangendo múltiplas arquiteturas e opções de aceleração por hardware.

github llama.cpp · há 12 d

LLaMA.cpp Release b9715 Adiciona CUDA Col2Im 1D e Binários para Múltiplas Plataformas

A versão b9715 do LLaMA.cpp introduz suporte a CUDA para GGML_OP_COL2IM_1D, construindo sobre uma implementação em CPU. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e frameworks de aceleração, incluindo Vulkan, ROCm, OpenVINO e SYCL.

github llama.cpp · há 13 d

llama.cpp lança b9711: novos binários e atualizações

O llama.cpp lançou a versão b9711 com binários atualizados para macOS, Linux, Android, Windows e openEuler. A versão inclui suporte para ARM64, x64, Vulkan, ROCm, OpenVINO, SYCL e HIP, com binários dedicados para aceleração de CPU e GPU. Um novo pacote de UI também está disponível.

github llama.cpp · há 13 d

llama.cpp release b9712 corrige build da UI com código-fonte somente leitura

A versão b9712 do llama.cpp inclui uma correção para problemas de build da UI causados por arquivos de origem somente leitura. O lançamento fornece binários pré-compilados para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.

lab Claude Code Releases · há 13 d

Notas de Lançamento v2.1.183

A v2.1.183 melhora a segurança do modo automático bloqueando comandos git e destroy destrutivos sem consentimento explícito do usuário. Adiciona avisos de descontinuação para modelos, introduz attribution.sessionUrl para ocultar links de sessão e corrige vários problemas, incluindo comportamento do terminal, desempenho do subagente e manipulação de entrada em ambientes web e tmux.

github llama.cpp · há 13 d

Lançamento do llama.cpp b9707 adiciona validação de esquema e novos builds binários

A versão b9707 do llama.cpp introduz validação de esquema e melhorias nas mensagens de erro. Inclui builds binários para macOS, Linux, Android, Windows e openEuler em várias arquiteturas e opções de aceleração de hardware.

github LangGraph · há 13 d

langgraph lança versão 1.2.6

LangGraph lança versão 1.2.6, corrigindo uma regressão em que subgrafos aninhados herdavam incorretamente o checkpoint_ns do pai. A atualização também melhora o cancelamento de subgrafos em execução durante abortos de stream e inclui uma atualização da versão da CLI para 0.4.30.

github llama.cpp · há 13 d

Lançamento do llama.cpp b9703: Atualizações e Downloads Binários

A versão b9703 do llama.cpp inclui uma reformulação do tratamento de presets do servidor, removendo o suporte a presets remotos da HF e funções obsoletas. O lançamento fornece binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 13 d

llama.cpp release b9704: corrige manipulação de gramática inválida e adiciona novos binários

A versão b9704 do llama.cpp agora retorna HTTP 400 para gramática inválida em vez de descartar silenciosamente as restrições. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em várias arquiteturas e aceleradores de hardware, com suporte para Vulkan, ROCm, OpenVINO, SYCL e CUDA.

github llama.cpp · há 13 d

Lançamento do llama.cpp b9702: Correções e Novos Binários

A versão b9702 do llama.cpp inclui uma correção para os argumentos do roteador que não estavam sendo encaminhados para as instâncias filhas. O lançamento fornece binários para macOS, Linux, Android, Windows e openEuler em várias arquiteturas e opções de aceleração de hardware, incluindo Vulkan, ROCm, OpenVINO e SYCL.

github llama.cpp · há 13 d

llama.cpp release b9701: novo pré-processador e binários multiplataforma

A versão b9701 do llama.cpp introduz um pré-processor refactorizado com a nova funcionalidade mtmd_image_preproc_out e documentação atualizada para desenvolvedores. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 13 d

llama.cpp release b9700: novos binários e atualizações da API SYCL

A versão b9700 do llama.cpp introduz suporte SYCL atualizado com flags de API renomeadas: GGML_SYCL_SUPPORT_LEVEL_ZERO renomeado para GGML_SYCL_SUPPORT_LEVEL_ZERO_API e GGML_SYCL_ENABLE_LEVEL_ZERO renomeado para GGML_SYCL_USE_LEVEL_ZERO_API. O release inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, ROCm, OpenVINO e SYCL.

github llama.cpp · há 13 d

LLaMA.cpp Release b9698 Adiciona Suporte a Autoatualização e Binários para Múltiplas Plataformas

A versão b9698 do LLaMA.cpp permite autoatualizações apenas quando compilada com llama-install.sh. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 13 d

llama.cpp Release b9699 Adds SYCL Support and Multiple Platform Binaries

llama.cpp version b9699 introduces support for MUL_MAT and OUT_PROD operations with Q1_0 precision via PR #24721. The release includes precompiled binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures and acceleration frameworks, including SYCL (FP32 and FP16), Vulkan, CUDA, ROCm, and OpenVINO.