Todos os artigos
media Hugging Face Forums · há 3 d

A Arquitetura de Contexto Geracional: Resolvendo a Degradação do Contexto em LLMs

A Arquitetura de Contexto Geracional (GCA) propõe tratar a janela de contexto de um LLM como uma vida útil finita, em vez de armazenamento infinito, para resolver a "degradação do contexto" e a diluição da atenção em sistemas multiagente. Ao impor mortalidade artificial, os agentes são encerrados antes que o desempenho se degrade, transferindo seu estado para novas gerações por meio de um cofre Markdown em arquivo plano.

lab OpenAI News · há 3 d

HP Inc. lança parceria estratégica Frontier com a OpenAI

A HP Inc. está ampliando sua parceria estratégica com a OpenAI após pilotos bem-sucedidos, implementando IA em experiências do cliente, produtividade dos funcionários e desenvolvimento de software. A empresa utiliza a plataforma OpenAI Frontier como um modelo operacional unificado para governar contexto, permissões e avaliação à medida que avança de casos de uso experimentais para produção em toda a empresa.

media Hugging Face Forums · há 3 d

HoLo-ToLk: Modelos de fala sem tokenizador em substrato HSL de 0 parâmetros

O autor apresenta o HoLo-ToLk, um projeto de pesquisa que constrói modelos de fala-para-texto (STT) e texto-para-fala (TTS) usando o substrato de bytes HSL de zero parâmetros sem tokenizadores ou embeddings de entrada aprendidos. O trabalho demonstra que os bytes brutos do HSL podem servir como um sinal viável para processamento de áudio quando combinados com modificações arquiteturais específicas.

github llama.cpp · há 5 d

lançamento b9827 do llama.cpp adiciona otimização de cópia assíncrona 2D do CUDA

O lançamento b9827 do llama.cpp introduz uma otimização de desempenho para o CUDA, adicionando um caminho rápido cudaMemcpy2DAsync à função ggml_cuda_cpy. Esta alteração acelera cópias em stride com mesmo tipo e mesma forma, onde os tensores não são totalmente contíguos, mas cada linha é contígua, substituindo kernels de cópia escalar elemento a elemento mais lentos.