Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 16

Wmf: uma nova técnica experimental

O conteúdo do artigo foi removido pelo autor, não deixando informações substanciais sobre a técnica.

LLM Local no MacBook M5 Pro - Totalmente Novo nisso!

Um não-programador compartilha sua experiência configurando uma infraestrutura de Modelo de Linguagem Grande local em um MacBook M5 Max com 128GB de memória unificada. O usuário detalha sua pilha de software, seleções de modelos e objetivos para aprender IA enquanto estabelece um sistema estável e acessível remotamente.

media Together AI Blog · há 9 h

Together AI na ICML 2026: pesquisa de ponta em toda a pilha

A Together AI está apresentando nove artigos na ICML 2026 que cobrem toda a pilha do desenvolvimento de sua plataforma.

lab Hugging Face Blog · há 10 h

Hugging Face e Cerebras trazem Gemma 4 para IA de voz em tempo real

A Hugging Face e a Cerebras integraram o modelo Gemma 4 do Google em suas plataformas para habilitar aplicações de inteligência artificial de voz em tempo real. Esta colaboração permite que os desenvolvedores aproveitem as capacidades multimodais do Gemma 4 para tarefas de processamento de áudio com baixa latência.

media Together AI Blog · há 10 h

Anunciamos nossa rodada C de $800M para acelerar a transição para IA de código aberto

A empresa levantou US$ 800 milhões em uma rodada de financiamento Série C destinada a acelerar a transição para inteligência artificial de código aberto.

lab Hugging Face Blog · há 10 h

ScarfBench: Avaliando Agentes de IA para Migração de Frameworks Enterprise Java

Este artigo apresenta o ScarfBench, um benchmark projetado para avaliar o desempenho de agentes de IA na migração de aplicações empresariais Java entre diferentes frameworks. O estudo destaca a complexidade da migração de frameworks e propõe um método de avaliação padronizado para avaliar as capacidades dos agentes neste domínio.

github CrewAI · há 12 h

Notas de lançamento do crewAI 1.15.2a1

O lançamento do crewAI 1.15.2a1 introduz vários novos recursos, correções de bugs e atualizações de documentação para o framework de orquestração de agentes.

github llama.cpp · há 17 h

Lançamento do llama.cpp b9858 com correção de caminho de modelo HF

O projeto llama.cpp lançou a versão b9858, que inclui uma alteração para usar o split principal do Hugging Face como o caminho do modelo. Esta atualização resolve a issue #25181 referente aos caminhos de carregamento de modelos.

github llama.cpp · há 19 h

Lançamento b9857 do llama.cpp: Reestruturação do Flash Attention e novos binários

O lançamento b9857 do llama.cpp introduz uma reestruturação abrangente da implementação do Hexagon Flash Attention, focando em otimizações e melhorias de precisão. Esta atualização inclui mudanças significativas nos módulos hex-mm e hex-fa, como a incorporação de tarefas de quantização nos threads principais de matmul, fusão com operações ADD e otimização do processamento de máscaras.

github llama.cpp · há 23 h

lançamento b9855 do llama.cpp adiciona otimização AVX2 nvfp4 e novos binários

O projeto llama.cpp lançou a versão b9855, que introduz uma otimização AVX2 para o produto interno nvfp4 usando uma Tabela de Busca (LUT) UE4M3 dentro do backend ggml-cpu.

github llama.cpp · há 23 h

lançamento b9856 do llama.cpp com restrito CUDA + PDL para FA

O projeto llama.cpp lançou a versão b9856, introduzindo o uso consistente da palavra-chave `restrict` e PDL para Flash Attention em CUDA. Esta atualização é acompanhada por binários pré-compilados para macOS, Linux, Android, Windows e openEuler em vários backends de hardware.

github llama.cpp · há 1 d

Remover fallback de navegação do PWA para evitar o cache de solicitações de endpoints da API

A atualização remove o mecanismo de fallback de navegação do Progressive Web App (PWA). Essa alteração é implementada especificamente para evitar o armazenamento em cache não intencional de solicitações de endpoints da API.

github llama.cpp · há 1 d

lançamento b9852 do llama.cpp adiciona suporte a q1_0 via OpenCL

O projeto llama.cpp lançou a versão b9852, introduzindo suporte inicial ao OpenCL para o formato de quantização q1_0. Esta atualização inclui capacidades gerais de q1_0 e implementações específicas de GEMM/GEMV para Adreno em dispositivos OpenCL.

lab Anthropic News · há 1 d

Anthropic reimplanta o Fable 5 após controles de exportação dos EUA

A Anthropic está restaurando o acesso global aos seus modelos Claude Fable 5 e Mythos 5 após o governo dos EUA levantar os controles de exportação que haviam suspendido a disponibilidade para todos os usuários. O Fable 5 estará disponível globalmente a partir de 1º de julho na Plataforma Claude, com limites de uso aplicados até 7 de julho antes de mudar para acesso baseado em créditos.

github llama.cpp · há 1 d

Lançamento b9851 do llama.cpp corrige truncamento inteiro da CUDA e fornece binários

O projeto llama.cpp lançou a versão b9851, que inclui uma correção para a CUDA para prevenir erros de truncamento inteiro e estouro no kernel flash_attn_mask_to_KV_max. Esta atualização aborda problemas relacionados aos passos da máscara KQ dentro do kernel especificado.

github llama.cpp · há 1 d

Lançamento b9850 do llama.cpp: correções para Qwen3 e novos binários

O lançamento b9850 do llama.cpp introduz atualizações de suporte específico a modelos, incluindo o registro do tensor t_layer_inp para Qwen3Next, correção da atribuição de entrada no loop de processamento da camada e resolução de problemas DFLASH para qwen-coder-next. Também adiciona um tensor para normalização de atenção no modelo Qwen3.

github MCP (GitHub org) · há 1 d

SDK Python MCP v2.0.0b1 Lançado com Suporte Completo à Especificação de 2026

O SDK Python do Model Context Protocol (MCP) lançou sua primeira versão beta, v2.0.0b1, que introduz suporte completo à especificação MCP de 2026-07-28. Esta pré-lançamento é apenas por adesão opcional, garantindo que as instalações padrão continuem a resolver para a linha estável 1.x.

lab Microsoft Research Blog · há 2 d

SkillOpt: Habilidades de agentes como parâmetros treináveis

A Microsoft Research apresenta o SkillOpt, um método que trata arquivos de habilidades de agentes como parâmetros treináveis fora de um modelo alvo congelado, transformando a edição manual de habilidades em um processo de otimização controlado. Esta abordagem melhora a confiabilidade e consistência dos agentes sem atualizar os pesos do modelo subjacente.

lab Anthropic News · há 2 d

Claude Science, uma bancada de trabalho com IA para cientistas, já está disponível

A Anthropic lançou o Claude Science em versão beta, uma bancada de trabalho com IA projetada para integrar ferramentas científicas fragmentadas em um único ambiente de pesquisa. A plataforma visa acelerar a descoberta fornecendo artefatos auditáveis, escalonamento flexível de computação e agentes especializados para domínios como genômica e biologia estrutural.

lab Anthropic News · há 2 d

Apresentando o Claude Sonnet 5

A Anthropic lançou o Claude Sonnet 5, um novo modelo de IA agêntica projetado para realizar planejamento complexo, uso de ferramentas e tarefas autônomas de codificação a um custo menor do que os modelos anteriores da classe Opus. A atualização reduz a lacuna de desempenho em relação ao Opus 4.8, enquanto oferece melhorias significativas no raciocínio, segurança e execução em comparação com seu antecessor, o Sonnet 4.6.