Todos os artigos
github llama.cpp · há 7 h

Lançamento b9857 do llama.cpp: Reestruturação do Flash Attention e novos binários

O lançamento b9857 do llama.cpp introduz uma reestruturação abrangente da implementação do Hexagon Flash Attention, focando em otimizações e melhorias de precisão. Esta atualização inclui mudanças significativas nos módulos hex-mm e hex-fa, como a incorporação de tarefas de quantização nos threads principais de matmul, fusão com operações ADD e otimização do processamento de máscaras.

lab Anthropic News · há 20 h

Anthropic reimplanta o Fable 5 após controles de exportação dos EUA

A Anthropic está restaurando o acesso global aos seus modelos Claude Fable 5 e Mythos 5 após o governo dos EUA levantar os controles de exportação que haviam suspendido a disponibilidade para todos os usuários. O Fable 5 estará disponível globalmente a partir de 1º de julho na Plataforma Claude, com limites de uso aplicados até 7 de julho antes de mudar para acesso baseado em créditos.

lab Anthropic News · há 1 d

Apresentando o Claude Sonnet 5

A Anthropic lançou o Claude Sonnet 5, um novo modelo de IA agêntica projetado para realizar planejamento complexo, uso de ferramentas e tarefas autônomas de codificação a um custo menor do que os modelos anteriores da classe Opus. A atualização reduz a lacuna de desempenho em relação ao Opus 4.8, enquanto oferece melhorias significativas no raciocínio, segurança e execução em comparação com seu antecessor, o Sonnet 4.6.