Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 19

A Capacidade Não Está nos Pesos: Resultado Negativo Empírico sobre Projeção de Pesos MLP

Um estudo empírico descobriu que projetar pesos MLP de um modelo transformer para outro falha em transferir capacidade semântica. Cada variante testada performou pior do que o modelo host não modificado, indicando uma limitação estrutural na projeção de pesos. Os resultados desafiam afirmações públicas sobre capacidades de modelos baseadas em benchmarks, mostrando que tais afirmações não refletem a geometria interna real dos pesos.

media Hugging Face Forums · há 10 d

The Clockwork Dark: Um Motor de RPG Narrativo Local-First com IA

The Clockwork Dark é um motor de RPG narrativo local-first, impulsionado por IA, que usa uma máquina de estados determinística para resolver todas as mecânicas do jogo. Ele apresenta dois LLMs autônomos que narram a história, com um atuando como uma voz paciente do mundo e o outro como um assistente divino e não confiável. O jogo oferece aos jogadores a escolha: lutar contra a corrupção sobrenatural iminente ou abraçar uma vida tranquila em uma padaria, sendo ambos os caminhos considerados finais válidos.

media Hugging Face Forums · há 10 d

Preso infinitamente em 'iniciando' com o container do Docker em execução

Um usuário relata que seu container do Docker com R/Shiny no rocker/r2u foi construído com sucesso e mostra 'Listening on http://0.0.0.0:7860' nos logs, mas o espaço permanece no estado 'starting' e é inacessível. O problema persiste apesar de não haver erros de código, e o usuário busca maior atenção, observando que pode ser um problema do lado da plataforma com a Hugging Face.

media Hugging Face Forums · há 10 d

NOVA-VAD supera Silero, Pyannote e WebRTC em áudio ruidoso com 93% de precisão

O NOVA-VAD, um detector de atividade de voz leve e explicável, alcança 93% de precisão em áudio ruidoso do conjunto de dados UrbanSound8K, superando o WebRTC (58%), Pyannote (62%) e Silero (87%). Ele usa apenas scikit-learn, não requer GPU e fornece importância de recursos e pontuações de confiança em inglês simples.

media Hugging Face Forums · há 10 d

Comparação de depuração em pequena escala do OLMo-core com enxerto Engram

Uma comparação de treinamento de 200 passos entre um modelo base OLMo3 600M e uma versão com enxerto Engram estilo DeepSeek mostra perda de treinamento e avaliação menores, estabilização mais rápida da norma do gradiente e comportamento de aprendizado inicial melhorado. O enxerto Engram, injetado nas camadas 1 e 5, aumenta os parâmetros treináveis para ~1,7B, mas mantém apenas um aumento de 40k nos parâmetros ativos por token, indicando uso eficiente de memória.

media Hugging Face Forums · há 10 d

LLMs como aceleradores epistêmicos: o risco não é apenas a alucinação

Os LLMs não apenas alucinam; eles amplificam a sobreconfiança epistêmica humana ao transformar hipóteses fracas em afirmações coerentes e polidas antes que as evidências sejam verificadas. Isso cria um risco de certeza prematura em pesquisa, políticas públicas e outros domínios, não porque os modelos mentem, mas porque aceleram as tendências humanas de favorecer explicações elegantes em vez da incerteza.

media Hugging Face Forums · há 10 d

Placas de Acelerador de IA Tenstorrent Disponíveis

A Tenstorrent lançou as placas de acelerador de IA Wormhole e Blackhole. A seção de hardware lista essas placas, com discussões sobre quais modelos são provavelmente compatíveis.

media Hugging Face Forums · há 10 d

Space travado em 'Reiniciando' no commit antigo por mais de 16 horas

Um Hugging Face Space ficou travado mostrando 'Reiniciando' no commit 8240352 por mais de 16 horas, apesar de vários commits mais recentes terem sido construídos com sucesso. O container inicia saudavelmente nos logs, mas o tráfego nunca muda para a nova versão, e ações de recuperação como rebuild de fábrica ou reinicialização não têm efeito.

github llama.cpp · há 10 d

llama.cpp Lança b9751: Novos Binários e Correções

O llama.cpp lança a versão b9751 com binários atualizados para macOS, Linux, Android, Windows e openEuler. A release inclui correções de uso de memória e suporta múltiplas arquiteturas e opções de aceleração de hardware como Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 10 d

llama.cpp lança b9752: refatoração do servidor e binários multiplataforma

O llama.cpp lança a versão b9752 com uma refatoração do servidor focada na construção de lotes, incluindo melhor tratamento de casos de lote cheio e correções de bugs. O lançamento inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e frameworks de aceleração como CUDA, Vulkan, OpenVINO e SYCL.

github llama.cpp · há 10 d

llama.cpp Lança b9753: Novos Binários e Relatórios de Progresso

A versão b9753 do llama.cpp introduz relatórios de progresso aprimorados para carregamento de modelos de especificação, incluindo uma nova lista "stages". O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, como Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 10 d

llama.cpp lança b9754: novo analisador AC e binários multiplataforma

A versão b9754 do llama.cpp introduz um analisador AC para geração de gramática mais rigorosa no módulo common/peg. O lançamento inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e tecnologias de aceleração como Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 10 d

Adicionar dependência do libandroid-spawn para compilação no Android

A documentação da compilação para Android foi atualizada para incluir uma dependência do libandroid-spawn. Essa adição tem como objetivo apoiar o processo de compilação dentro do ambiente especificado.

lab OpenAI News · há 10 d

Samsung implanta ChatGPT e Codex para funcionários

A Samsung Electronics lançou o ChatGPT Enterprise e o Codex da OpenAI para sua força de trabalho global. Esta implementação representa uma das maiores iniciativas de IA corporativa da OpenAI até o momento.

github llama.cpp · há 11 d

llama.cpp lança b9750: novo comando de chamada e binários multiplataforma

A versão b9750 do llama.cpp introduz uma implementação do comando de chamada e reverte uma alteração não intencional. O lançamento inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.

github llama.cpp · há 11 d

llama.cpp lança versão b9748 com novos binários e recursos

O llama.cpp lança a versão b9748, adicionando um campo "verbose" ao seu esquema e fornecendo binários para macOS, Linux, Android, Windows e openEuler. O lançamento inclui suporte a CPU, Vulkan, OpenVINO, SYCL e ROCm em múltiplas arquiteturas, com builds de CUDA e Vulkan para iOS e Windows disponíveis.

media Hugging Face Forums · há 11 d

Solicitação para forçar a exclusão do Hugging Face Space travado

O usuário solicita a exclusão forçada do Hugging Face Space "kayinda/rxsteward" travado no estado "Building". Todas as tentativas de exclusão falham com erros 403 ou erros de entrada inválida 400, impedindo a reutilização do nome.

lab Hugging Face Blog · há 11 d

Você pode superar o LoRA no ajuste fino?

Um novo estudo explora alternativas ao LoRA, a técnica de ajuste fino mais popular, avaliando se outros métodos podem alcançar melhor desempenho com menor custo computacional. A pesquisa conclui que, embora algumas abordagens mostrem potencial, nenhuma supera consistentemente o LoRA em tarefas e conjuntos de dados diversos.

lab Google DeepMind Blog · há 11 d

Roteiro de Controle de IA para Segurança de Sistemas Internos

Um Roteiro de Controle de IA foi introduzido para proteger sistemas internos, integrando salvaguardas tradicionais com capacidades de monitoramento em tempo real.

lab OpenAI News · há 11 d

GPT-5.5 Instant melhora as respostas de saúde do ChatGPT

O GPT-5.5 Instant melhora as respostas de saúde e bem-estar do ChatGPT por meio de raciocínio mais forte, melhor manejo de contexto, comunicação mais clara e avaliações informadas por médicos.