Todos os artigos
github llama.cpp · há 19 h

Lançamento b9857 do llama.cpp: Reestruturação do Flash Attention e novos binários

O lançamento b9857 do llama.cpp introduz uma reestruturação abrangente da implementação do Hexagon Flash Attention, focando em otimizações e melhorias de precisão. Esta atualização inclui mudanças significativas nos módulos hex-mm e hex-fa, como a incorporação de tarefas de quantização nos threads principais de matmul, fusão com operações ADD e otimização do processamento de máscaras.

lab Anthropic News · há 1 d

Anthropic reimplanta o Fable 5 após controles de exportação dos EUA

A Anthropic está restaurando o acesso global aos seus modelos Claude Fable 5 e Mythos 5 após o governo dos EUA levantar os controles de exportação que haviam suspendido a disponibilidade para todos os usuários. O Fable 5 estará disponível globalmente a partir de 1º de julho na Plataforma Claude, com limites de uso aplicados até 7 de julho antes de mudar para acesso baseado em créditos.