Todos os artigos — korshunov.ai

Todos os artigos Página 5 / 11

Lançamento b9789 do llama.cpp corrige quantização MoE e fornece binários multiplataforma

O projeto llama.cpp lançou a versão b9789, que inclui uma correção crítica para a quantização de modelos Mixture of Experts (MoE) com previsão multitempo. Esta atualização aborda problemas identificados no pull request #24986 para garantir o tratamento adequado dessas arquiteturas de modelo específicas. O lançamento fornece binários pré-compilados para macOS Apple Silicon e Intel, além de um iOS XCFramework. Usuários do Linux podem baixar builds para Ubuntu nos backends CPU, Vulkan, ROCm 7.2, OpenVINO e SYCL. O suporte para Windows inclui variantes CPU, CUDA 12.4 e 13.3, Vulkan, OpenVINO, SYCL e HIP. Plataformas adicionais como Android arm64 e openEuler também são suportadas com configurações de hardware específicas.

lab OpenAI News · há 7 d

Pesquisa da OpenAI mostra que agentes de IA estão transformando o trabalho

Um novo artigo de pesquisa da OpenAI demonstra como os agentes de inteligência artificial estão mudando fundamentalmente a natureza do trabalho. O estudo destaca a capacidade desses agentes de executar tarefas mais longas e complexas do que era possível anteriormente. Esse avanço tecnológico é creditado por expandir a produtividade em uma ampla variedade de funções profissionais. As descobertas sugerem uma mudança significativa na forma como o trabalho é organizado e realizado por meio da automação. Ao lidar com fluxos de trabalho intricados, os agentes de IA estão permitindo que os usuários alcancem maior eficiência. O artigo serve como evidência do crescente impacto dos sistemas autônomos no emprego moderno.

github llama.cpp · há 7 d

Corrigir casos de teste unitários falhos para conv_3d no SYCL

O repositório llama.cpp abordou uma questão específica relacionada ao backend SYCL. Um pull request foi submetido para corrigir os casos de teste unitários falhos associados à operação conv_3d. Esta atualização direciona-se ao projeto ggml-org/llama.cpp no GitHub. As alterações resolvem erros que anteriormente impediam a execução bem-sucedida desses testes. Esta correção garante maior estabilidade para usuários que dependem de aceleração de hardware baseada em SYCL.

github llama.cpp · há 7 d

Lançamento b9786 do llama.cpp adiciona suporte a linhas não contíguas via OpenCL

O projeto llama.cpp lançou a versão b9786, introduzindo suporte para linhas não contíguas na normalização por meio do OpenCL. Esta atualização faz parte do desenvolvimento contínuo pela equipe ggml-org para melhorar a compatibilidade de hardware e o desempenho em várias plataformas. O lançamento fornece binários para macOS Apple Silicon, Macs Intel e XCFrameworks para iOS. Usuários de Linux podem acessar builds para as arquiteturas Ubuntu x64, arm64 e s390x usando backends de CPU, Vulkan, ROCm 7.2, OpenVINO e SYCL. O suporte para Android está disponível para dispositivos com CPU arm64, enquanto o Windows oferece opções extensas incluindo CPU, CUDA 12 e 13, Vulkan, OpenVINO, SYCL e HIP. O lançamento também lista builds desativados para KleidiAI nas plataformas macOS e openEuler.

github llama.cpp · há 7 d

Lançamento do llama.cpp b9785 com Verificação de Caps Reforçada e Binários Multiplataforma

O projeto llama.cpp lançou a versão b9785, apresentando uma alteração no código para reforçar as verificações de caps, conforme detalhado no pull request #24973. Esta atualização fornece binários pré-compilados para macOS Apple Silicon, Macs Intel e iOS via XCFramework, com o suporte ao KleidiAI desativado no Apple Silicon. Distribuições Linux, incluindo Ubuntu, são suportadas para backends de CPU, Vulkan, ROCm 7.2, OpenVINO e SYCL nas arquiteturas x64, arm64 e s390x. Usuários do Android podem acessar binários de CPU arm64, enquanto o Windows oferece opções extensas cobrindo CPU, OpenCL Adreno, CUDA 12 e 13, Vulkan, OpenVINO, SYCL e HIP. O lançamento também inclui builds para openEuler direcionados a processadores x86 e aarch64 com suporte ao ACL Graph. Um pacote de UI independente está disponível junto aos lançamentos específicos da plataforma para facilitar a inferência local de modelos.

lab Claude Code Releases · há 7 d

Notas de Lançamento do Claude Code v2.1.191

A versão 2.1.191 do Claude Code introduz suporte para /rewind, permitindo que os usuários retomem conversas a partir de antes da execução de um comando /clear. A atualização corrige vários problemas críticos, incluindo agentes em segundo plano sendo ressuscitados após serem interrompidos e pulos na posição de rolagem durante respostas em streaming. Também corrige o comportamento em que /voice exibia mensagens de erro genéricas e onde URLs de /login eram truncadas no Windows Terminal. Melhorias significativas aumentam a confiabilidade para servidores MCP, adicionando lógica de retry para erros de rede transitórios durante a descoberta de capacidades e fluxos OAuth. Ambientes headless agora pulam pop-ups do navegador para OAuth, enquanto permissões de rede da sandbox são lembradas pela duração da sessão. Otimizações de desempenho reduzem o uso de CPU durante o streaming em aproximadamente 37% por meio da coalescência de atualizações de texto e mitigam o crescimento de memória em sessões longas proveniente do cache de saída do terminal.

github llama.cpp · há 7 d

LLaMA.cpp lança b9784: Otimizações de MM Hexagon e Binários Multiplataforma

O LLaMA.cpp lança a versão b9784 com grandes otimizações para operações MM baseadas em hexagon, incluindo repack de pesos com tile 32x32, tratamento melhorado do dyn.quant e gerenciamento unificado de parâmetros de kernel. O lançamento inclui novos binários para macOS (arm64 e x64), iOS e múltiplas arquiteturas Linux com suporte a Vulkan, ROCm e OpenVINO.

github llama.cpp · há 7 d

llama.cpp lança b9782 com novos binários e suporte

llama.cpp lança a versão b9782, incluindo binários para macOS, Linux, Android, Windows e openEuler. O lançamento adiciona suporte para Vulkan, OpenVINO, SYCL, ROCm e CUDA em múltiplas arquiteturas, com UI atualizada e recursos desativados como suporte a KleidiAI e openEuler.

lab Google DeepMind Blog · há 7 d

Gemini 3.5 Flash Adiciona Capacidade de Uso do Computador

O Google introduziu o uso do computador no Gemini 3.5 Flash, permitindo que o modelo execute código e interaja com ferramentas externas. Este recurso permite que os usuários executem tarefas de programação e acessem informações em tempo real por meio de funções de computação integradas.

lab Claude Code Releases · há 7 d

v2.1.190: Correções de bugs e melhorias de confiabilidade

A versão 2.1.190 inclui correções de bugs e melhorias de confiabilidade. Nenhuma nova funcionalidade foi anunciada nesta atualização.

github llama.cpp · há 7 d

llama.cpp lança b9781 com suporte a Vulkan e multiplataforma

O llama.cpp lança a versão b9781, adicionando suporte a Vulkan para Linux e Windows, e expandindo para múltiplas arquiteturas incluindo ARM64 e x64 em macOS, Linux, Android e Windows. O lançamento inclui builds de CPU, CUDA, OpenVINO, SYCL e ROCm, com um componente de UI disponível.

lab Mistral AI News · há 7 d

Novos controles de conector para segurança e acesso corporativo

O Mistral Studio agora oferece controles administrativos aprimorados para gerenciar o acesso ao conector por workspace e ferramenta, permitindo permissões granulares. Os recursos incluem chaves de API com escopos, conectores multi-conta e um novo Conector Debugger para análise de causa raiz, tudo suportando integração segura e auditável com sistemas corporativos.

lab Microsoft Research Blog · há 7 d

Talos: Reanálise Genômica Automatizada para Diagnóstico de Doenças Raras

O Talos é uma ferramenta de código aberto que automatiza a reanálise iterativa de dados genômicos para identificar diagnósticos de doenças raras. Ele alcançou uma taxa de recuperação de 90% dos diagnósticos dentro do escopo, com apenas 1,3 variantes candidatas por paciente, e forneceu 241 novos diagnósticos em 5.000 pacientes sem diagnóstico, com a maioria das novas descobertas surgindo dentro de 32 dias da publicação das evidências.

lab OpenAI News · há 7 d

OpenAI e Broadcom lançam chip de inferência otimizado para LLM

A OpenAI e a Broadcom apresentaram o Jalapeño, um chip de IA personalizado projetado para inferência de modelos de linguagem grandes. O chip visa melhorar o desempenho, a eficiência e a escalabilidade em sistemas de IA.

github llama.cpp · há 8 d

vulkan-shaders-gen agora falha na compilação ao encontrar erros de compilação de shaders

A ferramenta vulkan-shaders-gen agora detecta e falha na compilação quando a compilação do shader falha, impedindo a criação de uma libggml-vulkan defeituosa. Esta correção aborda um problema anterior em que o sucesso da compilação mascarava falhas em tempo de execução, e inclui melhorias no tratamento de erros e gerenciamento de flags atômicas entre plataformas.

github llama.cpp · há 8 d

Relese do LLaMA.cpp b9777 adiciona novos modelos e binários multiplataforma

A release b9777 do LLaMA.cpp adiciona os modelos LFM2.5-ColBERT-350M e LFM2.5-Embedding-350M. A release inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e tecnologias de aceleração como CUDA, Vulkan, OpenVINO e SYCL.

github vLLM · há 8 d

v0.24.0rc1: Corrige compilação do histograma topk no SM75

vllm lança v0.24.0rc1, incluindo correção para problemas de compilação do histograma topk no SM75. A alteração foi cherry-picked do commit 191826e e aprovada por Mohammad Miadh Angkad.

github OpenAI Agents SDK · há 8 d

Lançamento do openai-agents-python v0.17.7

A versão 0.17.7 da biblioteca openai-agents-python inclui novos recursos, como tamanho máximo configurável do WebSocket e streaming de chamadas de ferramentas de Chat Completions com buffer. Também contém várias correções para problemas, incluindo buffering da sandbox, tratamento de erros e despacho de ferramentas, além de atualizações na documentação e melhorias nas mensagens de erro.

github llama.cpp · há 8 d

Lançamento b9776 do llama.cpp adiciona suporte a Vulkan e múltiplos hardwares

A versão b9776 do llama.cpp introduz suporte a Vulkan para Linux e Windows, junto com variantes de CPU, OpenCL, CUDA e SYCL em macOS, Linux, Android e Windows. O lançamento também inclui suporte para OpenVINO e ROCm, com interface de usuário disponível em um pacote independente.

lab Claude Code Releases · há 8 d

Notas de Lançamento do Claude v2.1.187

O Claude v2.1.187 introduz bloqueio de credenciais em sandbox, restrições de modelo configuradas pela organização, suporte a cliques do mouse em tela cheia e correções para falhas de comando, travamentos de ferramentas e estabilidade da interface. As atualizações também melhoram o tratamento de saída estruturada, rastreamento de profundidade de agentes e gerenciamento de plugins, com aprimoramentos na compatibilidade com VSCode e terminal.