Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 19

Context Gravity

Chris Diaz compartilhou um novo projeto chamado Context Gravity, que está disponível no GitHub. O autor está buscando feedback da comunidade sobre o repositório.

media Hugging Face Forums · há 14 h

Prism Transformer: Agendamentos Progressivos de Cabeças para Processamento de Atenção Hierárquica

O Prism Transformer introduz um agendamento progressivo de cabeças que varia o número de cabeças de atenção entre as camadas, começando com menos cabeças mais largas nas camadas iniciais e aumentando a contagem monotonicamente com a profundidade. Esta abordagem desafia a alocação uniforme padrão ao atender às necessidades estruturais distintas das camadas iniciais versus tardias sem adicionar sobrecarga arquitetural.

github CrewAI · há 14 h

Notas de lançamento do LangChain v1.15.2a2

Esta versão atualiza o LangChain com novos recursos para integração com Bedrock, documentação do agente de fluxo e navegação em streaming, além de correções de bugs e melhorias na documentação.

media Hugging Face Forums · há 15 h

Sonho Fractal + Planejamento Inspirado em Quântica: Uma Ferramenta de Descoberta de Conhecimento Auto-organizada com DeepSeek Coder

O autor apresenta uma ferramenta de descoberta de conhecimento auto-organizada que integra a geração de padrões fractais e superposição inspirada na mecânica quântica para aprimorar a exploração de espaços de conhecimento do DeepSeek Coder. O sistema otimiza as trajetórias de busca armazenando caminhos criativos bem-sucedidos como consultas em cache, em vez de memória, adaptando o uso de recursos com base nas limitações de hardware.

media Hugging Face Forums · há 15 h

Wmf: uma nova técnica experimental

O conteúdo do artigo foi removido pelo autor, não deixando informações substanciais sobre a técnica.

media Hugging Face Forums · há 15 h

LLM Local no MacBook M5 Pro - Totalmente Novo nisso!

Um não-programador compartilha sua experiência configurando uma infraestrutura de Modelo de Linguagem Grande local em um MacBook M5 Max com 128GB de memória unificada. O usuário detalha sua pilha de software, seleções de modelos e objetivos para aprender IA enquanto estabelece um sistema estável e acessível remotamente.

media Together AI Blog · há 16 h

Together AI na ICML 2026: pesquisa de ponta em toda a pilha

A Together AI está apresentando nove artigos na ICML 2026 que cobrem toda a pilha do desenvolvimento de sua plataforma.

lab Hugging Face Blog · há 17 h

Hugging Face e Cerebras trazem Gemma 4 para IA de voz em tempo real

A Hugging Face e a Cerebras integraram o modelo Gemma 4 do Google em suas plataformas para habilitar aplicações de inteligência artificial de voz em tempo real. Esta colaboração permite que os desenvolvedores aproveitem as capacidades multimodais do Gemma 4 para tarefas de processamento de áudio com baixa latência.

media Together AI Blog · há 17 h

Anunciamos nossa rodada C de $800M para acelerar a transição para IA de código aberto

A empresa levantou US$ 800 milhões em uma rodada de financiamento Série C destinada a acelerar a transição para inteligência artificial de código aberto.

lab Hugging Face Blog · há 17 h

ScarfBench: Avaliando Agentes de IA para Migração de Frameworks Enterprise Java

Este artigo apresenta o ScarfBench, um benchmark projetado para avaliar o desempenho de agentes de IA na migração de aplicações empresariais Java entre diferentes frameworks. O estudo destaca a complexidade da migração de frameworks e propõe um método de avaliação padronizado para avaliar as capacidades dos agentes neste domínio.

github CrewAI · há 18 h

Notas de lançamento do crewAI 1.15.2a1

O lançamento do crewAI 1.15.2a1 introduz vários novos recursos, correções de bugs e atualizações de documentação para o framework de orquestração de agentes.

lab Claude Code Releases · há 20 h

Notas de Lançamento do Claude Code v2.1.198

A atualização v2.1.198 do Claude Code introduz a disponibilidade geral do Claude no Chrome e aprimora as capacidades de agentes em segundo plano com novos hooks de notificação e fluxos de trabalho automatizados de pull request.

lab Google — The Keyword (AI) · há 21 h

Educadores de NYC e líderes da indústria se reúnem no Google para moldar a IA nas salas de aula

Google, o Conselho de CEOs de Empregos de Nova York e Urban Assembly sediaram uma cúpula de IA para 150 líderes da educação e da indústria nos escritórios do Google. O evento reuniu partes interessadas para discutir e moldar o futuro da integração da inteligência artificial dentro dos ambientes de sala de aula.

lab Google — The Keyword (AI) · há 21 h

Últimas notícias de IA do Google anunciadas em junho de 2026

Este artigo apresenta um resumo das atualizações e anúncios de inteligência artificial lançados pelo Google durante junho de 2026.

github llama.cpp · há 22 h

Lançamento b9859 do llama.cpp adiciona suporte a kernels pré-compilados OpenCL

O lançamento b9859 do llama.cpp introduz a capacidade de carregar kernels binários pré-compilados de bibliotecas para OpenCL, direcionados especificamente para GPUs Adreno. Esta atualização também fornece binários para macOS, Linux, Windows, Android e openEuler em CPU, GPU e vários backends de acelerador.

lab xAI News · há 23 h

xAI lança Construtor de Agente de Voz sem Código para Grok Voice

A xAI anunciou o lançamento beta do Voice Agent Builder, uma plataforma sem código projetada para configurar agentes de voz de nível de produção no Grok Voice em menos de dois minutos. Esta ferramenta permite que operadores e desenvolvedores implantem agentes de voz de alto volume sem construir a pilha de telefonia ou IA subjacente do zero.

github llama.cpp · há 23 h

Lançamento do llama.cpp b9858 com correção de caminho de modelo HF

O projeto llama.cpp lançou a versão b9858, que inclui uma alteração para usar o split principal do Hugging Face como o caminho do modelo. Esta atualização resolve a issue #25181 referente aos caminhos de carregamento de modelos.

github llama.cpp · há 1 d

Lançamento b9857 do llama.cpp: Reestruturação do Flash Attention e novos binários

O lançamento b9857 do llama.cpp introduz uma reestruturação abrangente da implementação do Hexagon Flash Attention, focando em otimizações e melhorias de precisão. Esta atualização inclui mudanças significativas nos módulos hex-mm e hex-fa, como a incorporação de tarefas de quantização nos threads principais de matmul, fusão com operações ADD e otimização do processamento de máscaras.

github llama.cpp · há 1 d

lançamento b9855 do llama.cpp adiciona otimização AVX2 nvfp4 e novos binários

O projeto llama.cpp lançou a versão b9855, que introduz uma otimização AVX2 para o produto interno nvfp4 usando uma Tabela de Busca (LUT) UE4M3 dentro do backend ggml-cpu.

github llama.cpp · há 1 d

lançamento b9856 do llama.cpp com restrito CUDA + PDL para FA

O projeto llama.cpp lançou a versão b9856, introduzindo o uso consistente da palavra-chave `restrict` e PDL para Flash Attention em CUDA. Esta atualização é acompanhada por binários pré-compilados para macOS, Linux, Android, Windows e openEuler em vários backends de hardware.