Todos os artigos
media Hugging Face Forums · há 2 d

AgentSeal: Uma Auditoria de Disponibilidade de Corpus do SWE-bench Pro

A ferramenta de auditoria AgentSeal v5 avaliou a disponibilidade pública de artefatos no benchmark SWE-bench Pro para avaliar riscos potenciais de contaminação. O estudo constatou que, embora 12 instâncias apresentassem sobreposição de conteúdo determinística e 76 repositórios fossem membros prováveis do corpus, a maioria das evidências consistiu em replicação pública sem data conhecida, em vez de contaminação pré-corte comprovada.

lab Microsoft Research Blog · há 2 d

Memora: Uma Representação de Memória Harmônica que Equilibra Abstração e Especificidade

A Microsoft Research apresenta o Memora, um framework escalável de memória agêntica projetado para equilibrar abstração e especificidade em tarefas de IA de longo prazo. O sistema desacopla o conteúdo rico da memória das estruturas leves de recuperação, estabelecendo novos resultados state-of-the-art em benchmarks enquanto utiliza até 98% menos tokens de contexto.

lab Meta AI / FAIR Blog · há 3 d

Brain2Qwerty v2 Alcança 61% de Precisão em Decodificação Não Invasiva de Cérebro para Texto

Pesquisadores lançaram o Brain2Qwerty v2, um pipeline de IA não invasivo que decodifica frases em tempo real a partir de gravações de magnetoencefalografia (MEG) sem implantes cirúrgicos. O sistema alcança uma taxa de precisão de palavras de 61% no geral e até 78% para os melhores participantes, superando significativamente métodos não invasivos anteriores.

lab OpenAI News · há 3 d

HP Inc. lança parceria estratégica Frontier com a OpenAI

A HP Inc. está ampliando sua parceria estratégica com a OpenAI após pilotos bem-sucedidos, implementando IA em experiências do cliente, produtividade dos funcionários e desenvolvimento de software. A empresa utiliza a plataforma OpenAI Frontier como um modelo operacional unificado para governar contexto, permissões e avaliação à medida que avança de casos de uso experimentais para produção em toda a empresa.