Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 19

Wmf: uma nova técnica experimental

O conteúdo do artigo foi removido pelo autor, não deixando informações substanciais sobre a técnica.

LLM Local no MacBook M5 Pro - Totalmente Novo nisso!

Um não-programador compartilha sua experiência configurando uma infraestrutura de Modelo de Linguagem Grande local em um MacBook M5 Max com 128GB de memória unificada. O usuário detalha sua pilha de software, seleções de modelos e objetivos para aprender IA enquanto estabelece um sistema estável e acessível remotamente.

media Together AI Blog · há 15 h

Together AI na ICML 2026: pesquisa de ponta em toda a pilha

A Together AI está apresentando nove artigos na ICML 2026 que cobrem toda a pilha do desenvolvimento de sua plataforma.

lab Hugging Face Blog · há 15 h

Hugging Face e Cerebras trazem Gemma 4 para IA de voz em tempo real

A Hugging Face e a Cerebras integraram o modelo Gemma 4 do Google em suas plataformas para habilitar aplicações de inteligência artificial de voz em tempo real. Esta colaboração permite que os desenvolvedores aproveitem as capacidades multimodais do Gemma 4 para tarefas de processamento de áudio com baixa latência.

media Together AI Blog · há 15 h

Anunciamos nossa rodada C de $800M para acelerar a transição para IA de código aberto

A empresa levantou US$ 800 milhões em uma rodada de financiamento Série C destinada a acelerar a transição para inteligência artificial de código aberto.

lab Hugging Face Blog · há 15 h

ScarfBench: Avaliando Agentes de IA para Migração de Frameworks Enterprise Java

Este artigo apresenta o ScarfBench, um benchmark projetado para avaliar o desempenho de agentes de IA na migração de aplicações empresariais Java entre diferentes frameworks. O estudo destaca a complexidade da migração de frameworks e propõe um método de avaliação padronizado para avaliar as capacidades dos agentes neste domínio.

github CrewAI · há 17 h

Notas de lançamento do crewAI 1.15.2a1

O lançamento do crewAI 1.15.2a1 introduz vários novos recursos, correções de bugs e atualizações de documentação para o framework de orquestração de agentes.

lab Google — The Keyword (AI) · há 20 h

Últimas notícias de IA do Google anunciadas em junho de 2026

Este artigo apresenta um resumo das atualizações e anúncios de inteligência artificial lançados pelo Google durante junho de 2026.

github llama.cpp · há 21 h

Lançamento b9859 do llama.cpp adiciona suporte a kernels pré-compilados OpenCL

O lançamento b9859 do llama.cpp introduz a capacidade de carregar kernels binários pré-compilados de bibliotecas para OpenCL, direcionados especificamente para GPUs Adreno. Esta atualização também fornece binários para macOS, Linux, Windows, Android e openEuler em CPU, GPU e vários backends de acelerador.

lab xAI News · há 22 h

xAI lança Construtor de Agente de Voz sem Código para Grok Voice

A xAI anunciou o lançamento beta do Voice Agent Builder, uma plataforma sem código projetada para configurar agentes de voz de nível de produção no Grok Voice em menos de dois minutos. Esta ferramenta permite que operadores e desenvolvedores implantem agentes de voz de alto volume sem construir a pilha de telefonia ou IA subjacente do zero.

github llama.cpp · há 22 h

Lançamento do llama.cpp b9858 com correção de caminho de modelo HF

O projeto llama.cpp lançou a versão b9858, que inclui uma alteração para usar o split principal do Hugging Face como o caminho do modelo. Esta atualização resolve a issue #25181 referente aos caminhos de carregamento de modelos.

github llama.cpp · há 1 d

Lançamento b9857 do llama.cpp: Reestruturação do Flash Attention e novos binários

O lançamento b9857 do llama.cpp introduz uma reestruturação abrangente da implementação do Hexagon Flash Attention, focando em otimizações e melhorias de precisão. Esta atualização inclui mudanças significativas nos módulos hex-mm e hex-fa, como a incorporação de tarefas de quantização nos threads principais de matmul, fusão com operações ADD e otimização do processamento de máscaras.

github llama.cpp · há 1 d

lançamento b9855 do llama.cpp adiciona otimização AVX2 nvfp4 e novos binários

O projeto llama.cpp lançou a versão b9855, que introduz uma otimização AVX2 para o produto interno nvfp4 usando uma Tabela de Busca (LUT) UE4M3 dentro do backend ggml-cpu.

github llama.cpp · há 1 d

lançamento b9856 do llama.cpp com restrito CUDA + PDL para FA

O projeto llama.cpp lançou a versão b9856, introduzindo o uso consistente da palavra-chave `restrict` e PDL para Flash Attention em CUDA. Esta atualização é acompanhada por binários pré-compilados para macOS, Linux, Android, Windows e openEuler em vários backends de hardware.

github llama.cpp · há 1 d

Remover fallback de navegação do PWA para evitar o cache de solicitações de endpoints da API

A atualização remove o mecanismo de fallback de navegação do Progressive Web App (PWA). Essa alteração é implementada especificamente para evitar o armazenamento em cache não intencional de solicitações de endpoints da API.

github llama.cpp · há 1 d

lançamento b9852 do llama.cpp adiciona suporte a q1_0 via OpenCL

O projeto llama.cpp lançou a versão b9852, introduzindo suporte inicial ao OpenCL para o formato de quantização q1_0. Esta atualização inclui capacidades gerais de q1_0 e implementações específicas de GEMM/GEMV para Adreno em dispositivos OpenCL.

lab Anthropic News · há 2 d

Anthropic reimplanta o Fable 5 após controles de exportação dos EUA

A Anthropic está restaurando o acesso global aos seus modelos Claude Fable 5 e Mythos 5 após o governo dos EUA levantar os controles de exportação que haviam suspendido a disponibilidade para todos os usuários. O Fable 5 estará disponível globalmente a partir de 1º de julho na Plataforma Claude, com limites de uso aplicados até 7 de julho antes de mudar para acesso baseado em créditos.

github llama.cpp · há 2 d

Lançamento b9851 do llama.cpp corrige truncamento inteiro da CUDA e fornece binários

O projeto llama.cpp lançou a versão b9851, que inclui uma correção para a CUDA para prevenir erros de truncamento inteiro e estouro no kernel flash_attn_mask_to_KV_max. Esta atualização aborda problemas relacionados aos passos da máscara KQ dentro do kernel especificado.

github llama.cpp · há 2 d

Lançamento b9850 do llama.cpp: correções para Qwen3 e novos binários

O lançamento b9850 do llama.cpp introduz atualizações de suporte específico a modelos, incluindo o registro do tensor t_layer_inp para Qwen3Next, correção da atribuição de entrada no loop de processamento da camada e resolução de problemas DFLASH para qwen-coder-next. Também adiciona um tensor para normalização de atenção no modelo Qwen3.

github MCP (GitHub org) · há 2 d

SDK Python MCP v2.0.0b1 Lançado com Suporte Completo à Especificação de 2026

O SDK Python do Model Context Protocol (MCP) lançou sua primeira versão beta, v2.0.0b1, que introduz suporte completo à especificação MCP de 2026-07-28. Esta pré-lançamento é apenas por adesão opcional, garantindo que as instalações padrão continuem a resolver para a linha estável 1.x.