lançamento b9847 do llama.cpp corrige Gemma E4B MTP FlashAttention
O projeto llama.cpp lançou a versão b9847, que inclui uma correção para o Gemma E4B MTP FlashAttention no CUDA e a remoção de uma declaração de template não utilizada.
O projeto llama.cpp lançou a versão b9847, que inclui uma correção para o Gemma E4B MTP FlashAttention no CUDA e a remoção de uma declaração de template não utilizada.
O autor apresenta o Trajlens, um linter de código aberto para a categoria LeRobotDataset no Hugging Face Hub, e relata os resultados da auditoria de 100 datasets públicos aleatórios marcados com 'lerobot'. A auditoria revelou que apenas 19 datasets passaram na validação, enquanto 13 falharam devido a bugs específicos do upstream e 44 encontraram erros de carregamento ou timeouts.
Um pedido de recurso propõe a Rede Adversarial Epistemológica (EAN), uma arquitetura projetada para transformar a IA de um sistema que reflete o consenso institucional em um mecanismo de verificação descentralizado e multi-perspectivo. Esta abordagem visa eliminar jogadas de poder político e corporativo, removendo qualquer modelo único de "fonte da verdade".
Um tópico de discussão nos fóruns do Hugging Face pergunta aos usuários quais modelos de IA gratuitos ou de código aberto eles atualmente utilizam para o desenvolvimento de chatbots e seus motivos de preferência.
Um usuário nos fóruns do Hugging Face busca recomendações para modelos de IA sem censura capazes de raciocinar sobre tópicos complexos, citando preferência por versões anteriores do GPT-4 em vez das iterações atuais.
O projeto llama.cpp lançou a versão b9846, que inclui uma otimização do backend Vulkan para o Asahi Linux. Esta atualização reverte o loop do tamanho do bloco na multiplicação de matrizes para melhorar a compatibilidade e o desempenho no hardware Apple Silicon executando Linux.
O projeto llama.cpp lançou a versão b9844, que introduz o suporte ao ggml-webgpu para o formato de quantização NVFP4. Esta atualização também fornece binários pré-compilados para macOS, iOS, Linux, Android, Windows e openEuler em vários backends de hardware.
A ferramenta de auditoria AgentSeal v5 avaliou a disponibilidade pública de artefatos no benchmark SWE-bench Pro para avaliar riscos potenciais de contaminação. O estudo constatou que, embora 12 instâncias apresentassem sobreposição de conteúdo determinística e 76 repositórios fossem membros prováveis do corpus, a maioria das evidências consistiu em replicação pública sem data conhecida, em vez de contaminação pré-corte comprovada.
A Google UK publicou seu mais recente Relatório de Impacto Econômico, detalhando estratégias para ajudar mais pessoas a desbloquear os benefícios das tecnologias impulsionadas por IA no país.
O projeto llama.cpp publicou o lançamento b9843, fornecendo binários pré-compilados para macOS, Linux, Android, Windows e openEuler em várias arquiteturas de hardware.
A versão 1.2.7 do LangGraph foi lançada, introduzindo correções de bugs e atualizações de dependências para o ecossistema LangChain.
Um guia bilíngue de código aberto, em inglês e espanhol, detalhando o funcionamento interno dos Transformers foi publicado. O recurso abrange a matemática exata e a mecânica por trás do colapso da atenção e da compressão do KV-cache.
O projeto de pesquisa independente LIMEN analisa a dinâmica interna de sete modelos Transformer de código aberto, revelando que a ambiguidade semântica altera a geometria da trajetória e descobrindo uma gramática dinâmica universal entre as arquiteturas.
A Microsoft Research apresenta o Memora, um framework escalável de memória agêntica projetado para equilibrar abstração e especificidade em tarefas de IA de longo prazo. O sistema desacopla o conteúdo rico da memória das estruturas leves de recuperação, estabelecendo novos resultados state-of-the-art em benchmarks enquanto utiliza até 98% menos tokens de contexto.
A versão 2.1.196 do Claude Code introduz modelos padrão da organização, anexos de arquivos clicáveis e segurança aprimorada para aprovações de servidores MCP. A atualização também melhora a confiabilidade das sessões em segundo plano, corrige vários problemas de relatório de status do agente e otimiza o uso de tokens em fluxos de trabalho de revisão de código.
O artigo apresenta o DiScoFormer, um modelo transformer unificado capaz de realizar tanto estimativa de densidade quanto tarefas de geração baseada em score em várias distribuições de dados.
O Projeto UCTF foi reestruturado de uma única proposta em um programa de pesquisa aberto e orientado por hipóteses para investigar se representações intermediárias nativas para máquina podem reduzir a redundância semântica interlingual no treinamento de IA multilíngue.
Um usuário relata encontrar um erro ao tentar gerar um certificado de conclusão para o curso de RL Profundo na Hugging Face. O problema persiste apesar de inserir os detalhes obrigatórios de nome de usuário e nome, sem orientações existentes disponíveis online.
Um especialista do Google explica o conceito de adotar uma abordagem de stack completo para inteligência artificial. O artigo destaca que essa metodologia abrangente tem servido como base para o trabalho de IA do Google por um longo período.
O lançamento b9842 do llama.cpp introduz uma alteração para duplicar entradas de predefinição e modelos em cache no endpoint /v1/models. Esta atualização é aprovada por Adrien Gallouët, da Hugging Face.