Todos os artigos
lab Microsoft Research Blog · há 1 d

Memora: Uma Representação de Memória Harmônica que Equilibra Abstração e Especificidade

A Microsoft Research apresenta o Memora, um framework escalável de memória agêntica projetado para equilibrar abstração e especificidade em tarefas de IA de longo prazo. O sistema desacopla o conteúdo rico da memória das estruturas leves de recuperação, estabelecendo novos resultados state-of-the-art em benchmarks enquanto utiliza até 98% menos tokens de contexto.

lab Meta AI / FAIR Blog · há 2 d

Brain2Qwerty v2 Alcança 61% de Precisão em Decodificação Não Invasiva de Cérebro para Texto

Pesquisadores lançaram o Brain2Qwerty v2, um pipeline de IA não invasivo que decodifica frases em tempo real a partir de gravações de magnetoencefalografia (MEG) sem implantes cirúrgicos. O sistema alcança uma taxa de precisão de palavras de 61% no geral e até 78% para os melhores participantes, superando significativamente métodos não invasivos anteriores.

lab OpenAI News · há 2 d

HP Inc. lança parceria estratégica Frontier com a OpenAI

A HP Inc. está ampliando sua parceria estratégica com a OpenAI após pilotos bem-sucedidos, implementando IA em experiências do cliente, produtividade dos funcionários e desenvolvimento de software. A empresa utiliza a plataforma OpenAI Frontier como um modelo operacional unificado para governar contexto, permissões e avaliação à medida que avança de casos de uso experimentais para produção em toda a empresa.

github llama.cpp · há 4 d

lançamento b9827 do llama.cpp adiciona otimização de cópia assíncrona 2D do CUDA

O lançamento b9827 do llama.cpp introduz uma otimização de desempenho para o CUDA, adicionando um caminho rápido cudaMemcpy2DAsync à função ggml_cuda_cpy. Esta alteração acelera cópias em stride com mesmo tipo e mesma forma, onde os tensores não são totalmente contíguos, mas cada linha é contígua, substituindo kernels de cópia escalar elemento a elemento mais lentos.