Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 5

Lançamento b9843 do llama.cpp com binários para macOS, Linux e Windows

O projeto llama.cpp publicou o lançamento b9843, fornecendo binários pré-compilados para macOS, Linux, Android, Windows e openEuler em várias arquiteturas de hardware.

github LangGraph · há 1 d

Notas de Lançamento do LangGraph 1.2.7

A versão 1.2.7 do LangGraph foi lançada, introduzindo correções de bugs e atualizações de dependências para o ecossistema LangChain.

lab Microsoft Research Blog · há 1 d

Memora: Uma Representação de Memória Harmônica que Equilibra Abstração e Especificidade

A Microsoft Research apresenta o Memora, um framework escalável de memória agêntica projetado para equilibrar abstração e especificidade em tarefas de IA de longo prazo. O sistema desacopla o conteúdo rico da memória das estruturas leves de recuperação, estabelecendo novos resultados state-of-the-art em benchmarks enquanto utiliza até 98% menos tokens de contexto.

lab Claude Code Releases · há 1 d

Notas de Lançamento do Claude Code v2.1.196

A versão 2.1.196 do Claude Code introduz modelos padrão da organização, anexos de arquivos clicáveis e segurança aprimorada para aprovações de servidores MCP. A atualização também melhora a confiabilidade das sessões em segundo plano, corrige vários problemas de relatório de status do agente e otimiza o uso de tokens em fluxos de trabalho de revisão de código.

lab Google — The Keyword (AI) · há 2 d

Pergunte a um especialista em IA: O que exatamente é o stack completo?

Um especialista do Google explica o conceito de adotar uma abordagem de stack completo para inteligência artificial. O artigo destaca que essa metodologia abrangente tem servido como base para o trabalho de IA do Google por um longo período.

github llama.cpp · há 2 d

Lançamento b9842 do llama.cpp: predefinição de deduplicação e entradas de modelo em cache em /v1/models

O lançamento b9842 do llama.cpp introduz uma alteração para duplicar entradas de predefinição e modelos em cache no endpoint /v1/models. Esta atualização é aprovada por Adrien Gallouët, da Hugging Face.

lab Meta AI / FAIR Blog · há 2 d

Brain2Qwerty v2 Alcança 61% de Precisão em Decodificação Não Invasiva de Cérebro para Texto

Pesquisadores lançaram o Brain2Qwerty v2, um pipeline de IA não invasivo que decodifica frases em tempo real a partir de gravações de magnetoencefalografia (MEG) sem implantes cirúrgicos. O sistema alcança uma taxa de precisão de palavras de 61% no geral e até 78% para os melhores participantes, superando significativamente métodos não invasivos anteriores.

github llama.cpp · há 2 d

Lançamento b9840 do llama.cpp adiciona suporte ao DeepSeek V4 e binários multiplataforma

O lançamento b9840 do llama.cpp introduz suporte à conversão para o modelo DeepSeek V4, incluindo tratamento específico para a variante Pro. Esta atualização integra a nova arquitetura na biblioteca junto com várias otimizações internas e correções de bugs.

lab OpenAI News · há 2 d

Mapeando a Oportunidade da Força de Trabalho de IA na Europa

A OpenAI Economic Research estendeu seu Framework de Transição de Empregos de IA à União Europeia, utilizando a taxonomia ESCO e dados do Eurostat para analisar como as capacidades de IA podem remodelar os mercados de trabalho em todos os estados-membros.

github llama.cpp · há 2 d

Lançamento b9839 do llama.cpp com correção de varredura Tailwind e binários multiplataforma

O projeto llama.cpp lançou a versão b9839, que inclui uma correção para restaurar a varredura Tailwind em worktrees ignorados. Esta atualização fornece binários pré-compilados para macOS, Linux, Android, Windows e openEuler em várias arquiteturas e backends de aceleração de hardware.

github llama.cpp · há 2 d

Lançamento b9838 do llama.cpp: Builds para macOS, Linux, Windows e Android

O projeto llama.cpp lançou a versão b9838, fornecendo binários pré-compilados para uma ampla gama de sistemas operacionais e aceleradores de hardware. Este lançamento inclui suporte para CPU, GPU (CUDA, Vulkan, ROCm, OpenCL) e aceleradores de IA especializados em macOS, Linux, Windows, Android e openEuler.

lab OpenAI News · há 2 d

HP Inc. lança parceria estratégica Frontier com a OpenAI

A HP Inc. está ampliando sua parceria estratégica com a OpenAI após pilotos bem-sucedidos, implementando IA em experiências do cliente, produtividade dos funcionários e desenvolvimento de software. A empresa utiliza a plataforma OpenAI Frontier como um modelo operacional unificado para governar contexto, permissões e avaliação à medida que avança de casos de uso experimentais para produção em toda a empresa.

github llama.cpp · há 3 d

Lançamento b9835 do llama.cpp com correções de parada na interface e pulso de raciocínio

O projeto llama.cpp lançou a versão b9835, que inclui uma correção para a funcionalidade de parada e pulso de raciocínio no modo de modelo único. Esta atualização aborda problemas específicos dentro da interface do usuário para melhorar o controle durante a inferência do modelo.

github llama.cpp · há 3 d

Lançamento b9833 do llama.cpp: Parser para MiniCPM5 e binários multi-plataforma

O projeto llama.cpp lançou a versão b9833, introduzindo um parser dedicado para o modelo MiniCPM5 junto com várias correções de bugs e refatorações. Esta atualização inclui suporte para parsing de chamadas de ferramenta, simplificação de gramática e correção do comportamento da API Jinja para garantir compatibilidade com os padrões Jinja2.

github llama.cpp · há 3 d

Lançamento b9832 do llama.cpp adiciona flag de depuração --dump-prog

O projeto llama.cpp lançou a versão b9832, introduzindo uma nova opção de linha de comando `--dump-prog` para o mecanismo de template Jinja, visando auxiliar na depuração. Esta atualização também inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler em várias arquiteturas de CPU e GPU.

github llama.cpp · há 3 d

Lançamento b9831 do llama.cpp adiciona suporte ao DFlash e novos binários

O lançamento b9831 do llama.cpp introduz o suporte ao DFlash v2, incluindo atenção de janela deslizante por tipos de camada, juntamente com um conjunto abrangente de binários pré-compilados para várias plataformas.

github llama.cpp · há 3 d

lançamento b9830 do llama.cpp adiciona sinalizador --offline e corrige bug de memória

O lançamento b9830 do llama.cpp introduz a capacidade de usar o sinalizador --offline com o comando llama download, permitindo que scripts verifiquem modelos em cache sem acesso à rede. Esta atualização também resolve uma vulnerabilidade latente de uso após liberação no callback on_done da tarefa URL, onde first_path estava sendo capturado incorretamente por referência.

github llama.cpp · há 3 d

Lançamento b9829 do llama.cpp: Redução de Logs e Binários Multiplataforma

O projeto llama.cpp lançou a versão b9829, que inclui uma redução da saída de logs no servidor, componentes comuns e módulos de decodificação especulativa. Esta atualização também padroniza as convenções de nomenclatura, substituindo CMN_ por COM_.

github llama.cpp · há 3 d

Lançamento b9828 do llama.cpp: Melhorias no Flash Attention via OpenCL e novos binários

O lançamento b9828 do llama.cpp introduz melhorias significativas no OpenCL, reestruturando especificamente os kernels do Flash Attention para precisão f16 e f32. Esta atualização inclui novos kernels de pré-prefill e suporte para formatos de quantização q4_0 e q8_0.

github llama.cpp · há 4 d

lançamento b9827 do llama.cpp adiciona otimização de cópia assíncrona 2D do CUDA

O lançamento b9827 do llama.cpp introduz uma otimização de desempenho para o CUDA, adicionando um caminho rápido cudaMemcpy2DAsync à função ggml_cuda_cpy. Esta alteração acelera cópias em stride com mesmo tipo e mesma forma, onde os tensores não são totalmente contíguos, mas cada linha é contígua, substituindo kernels de cópia escalar elemento a elemento mais lentos.