Todos os artigos — korshunov.ai

Todos os artigos Página 3 / 15

lançamento b9847 do llama.cpp corrige Gemma E4B MTP FlashAttention

O projeto llama.cpp lançou a versão b9847, que inclui uma correção para o Gemma E4B MTP FlashAttention no CUDA e a remoção de uma declaração de template não utilizada.

media Hugging Face Forums · há 2 d

Trajlens: um validador para LeRobotDataset, com auditoria em 100 datasets do Hub

O autor apresenta o Trajlens, um linter de código aberto para a categoria LeRobotDataset no Hugging Face Hub, e relata os resultados da auditoria de 100 datasets públicos aleatórios marcados com 'lerobot'. A auditoria revelou que apenas 19 datasets passaram na validação, enquanto 13 falharam devido a bugs específicos do upstream e 44 encontraram erros de carregamento ou timeouts.

media Hugging Face Forums · há 2 d

Proposta de Arquitetura: A Rede Adversarial Epistemológica (EAN) para IA de Código Aberto

Um pedido de recurso propõe a Rede Adversarial Epistemológica (EAN), uma arquitetura projetada para transformar a IA de um sistema que reflete o consenso institucional em um mecanismo de verificação descentralizado e multi-perspectivo. Esta abordagem visa eliminar jogadas de poder político e corporativo, removendo qualquer modelo único de "fonte da verdade".

media Hugging Face Forums · há 2 d

Discussão da Comunidade sobre LLMs de Código Aberto para Desenvolvimento de Chatbots

Um tópico de discussão nos fóruns do Hugging Face pergunta aos usuários quais modelos de IA gratuitos ou de código aberto eles atualmente utilizam para o desenvolvimento de chatbots e seus motivos de preferência.

media Hugging Face Forums · há 2 d

Top 5 modelos que posso rodar com meu hardware? Sem lobotomização de IA

Um usuário nos fóruns do Hugging Face busca recomendações para modelos de IA sem censura capazes de raciocinar sobre tópicos complexos, citando preferência por versões anteriores do GPT-4 em vez das iterações atuais.

github llama.cpp · há 2 d

Lançamento b9846 do llama.cpp com otimização de matmul Vulkan para Asahi Linux

O projeto llama.cpp lançou a versão b9846, que inclui uma otimização do backend Vulkan para o Asahi Linux. Esta atualização reverte o loop do tamanho do bloco na multiplicação de matrizes para melhorar a compatibilidade e o desempenho no hardware Apple Silicon executando Linux.

github llama.cpp · há 2 d

Lançamento b9844 do llama.cpp adiciona suporte a NVFP4 e novos binários

O projeto llama.cpp lançou a versão b9844, que introduz o suporte ao ggml-webgpu para o formato de quantização NVFP4. Esta atualização também fornece binários pré-compilados para macOS, iOS, Linux, Android, Windows e openEuler em vários backends de hardware.

media Hugging Face Forums · há 2 d

AgentSeal: Uma Auditoria de Disponibilidade de Corpus do SWE-bench Pro

A ferramenta de auditoria AgentSeal v5 avaliou a disponibilidade pública de artefatos no benchmark SWE-bench Pro para avaliar riscos potenciais de contaminação. O estudo constatou que, embora 12 instâncias apresentassem sobreposição de conteúdo determinística e 76 repositórios fossem membros prováveis do corpus, a maioria das evidências consistiu em replicação pública sem data conhecida, em vez de contaminação pré-corte comprovada.

lab Google — The Keyword (AI) · há 2 d

Desbloqueando a próxima era de produtividade do Reino Unido: Construindo uma nação de pioneiros em IA

A Google UK publicou seu mais recente Relatório de Impacto Econômico, detalhando estratégias para ajudar mais pessoas a desbloquear os benefícios das tecnologias impulsionadas por IA no país.

github llama.cpp · há 2 d

Lançamento b9843 do llama.cpp com binários para macOS, Linux e Windows

O projeto llama.cpp publicou o lançamento b9843, fornecendo binários pré-compilados para macOS, Linux, Android, Windows e openEuler em várias arquiteturas de hardware.

github LangGraph · há 2 d

Notas de Lançamento do LangGraph 1.2.7

A versão 1.2.7 do LangGraph foi lançada, introduzindo correções de bugs e atualizações de dependências para o ecossistema LangChain.

media Hugging Face Forums · há 2 d

Guia Bilíngue de Código Aberto sobre Mecânica de Transformers Publicado

Um guia bilíngue de código aberto, em inglês e espanhol, detalhando o funcionamento interno dos Transformers foi publicado. O recurso abrange a matemática exata e a mecânica por trás do colapso da atenção e da compressão do KV-cache.

media Hugging Face Forums · há 2 d

[Pesquisa] De Geometria Funcional a Gramática Dinâmica: Novas Auditorias do LIMEN (V23–V24) em 7 Arquiteturas

O projeto de pesquisa independente LIMEN analisa a dinâmica interna de sete modelos Transformer de código aberto, revelando que a ambiguidade semântica altera a geometria da trajetória e descobrindo uma gramática dinâmica universal entre as arquiteturas.

lab Microsoft Research Blog · há 2 d

Memora: Uma Representação de Memória Harmônica que Equilibra Abstração e Especificidade

A Microsoft Research apresenta o Memora, um framework escalável de memória agêntica projetado para equilibrar abstração e especificidade em tarefas de IA de longo prazo. O sistema desacopla o conteúdo rico da memória das estruturas leves de recuperação, estabelecendo novos resultados state-of-the-art em benchmarks enquanto utiliza até 98% menos tokens de contexto.

lab Claude Code Releases · há 2 d

Notas de Lançamento do Claude Code v2.1.196

A versão 2.1.196 do Claude Code introduz modelos padrão da organização, anexos de arquivos clicáveis e segurança aprimorada para aprovações de servidores MCP. A atualização também melhora a confiabilidade das sessões em segundo plano, corrige vários problemas de relatório de status do agente e otimiza o uso de tokens em fluxos de trabalho de revisão de código.

lab Hugging Face Blog · há 3 d

DiScoFormer: Um transformer para densidade e score, através de distribuições

O artigo apresenta o DiScoFormer, um modelo transformer unificado capaz de realizar tanto estimativa de densidade quanto tarefas de geração baseada em score em várias distribuições de dados.

media Hugging Face Forums · há 3 d

Projeto UCTF: Um Programa de Pesquisa Aberto sobre Representações de Treinamento de IA Nativas para Máquina

O Projeto UCTF foi reestruturado de uma única proposta em um programa de pesquisa aberto e orientado por hipóteses para investigar se representações intermediárias nativas para máquina podem reduzir a redundância semântica interlingual no treinamento de IA multilíngue.

media Hugging Face Forums · há 3 d

Erro ao Gerar Certificado do Curso de RL Profundo

Um usuário relata encontrar um erro ao tentar gerar um certificado de conclusão para o curso de RL Profundo na Hugging Face. O problema persiste apesar de inserir os detalhes obrigatórios de nome de usuário e nome, sem orientações existentes disponíveis online.

lab Google — The Keyword (AI) · há 3 d

Pergunte a um especialista em IA: O que exatamente é o stack completo?

Um especialista do Google explica o conceito de adotar uma abordagem de stack completo para inteligência artificial. O artigo destaca que essa metodologia abrangente tem servido como base para o trabalho de IA do Google por um longo período.

github llama.cpp · há 3 d

Lançamento b9842 do llama.cpp: predefinição de deduplicação e entradas de modelo em cache em /v1/models

O lançamento b9842 do llama.cpp introduz uma alteração para duplicar entradas de predefinição e modelos em cache no endpoint /v1/models. Esta atualização é aprovada por Adrien Gallouët, da Hugging Face.