Todos os artigos
media Hugging Face Forums · há 10 d

A Capacidade Não Está nos Pesos: Resultado Negativo Empírico sobre Projeção de Pesos MLP

Um estudo empírico descobriu que projetar pesos MLP de um modelo transformer para outro falha em transferir capacidade semântica. Cada variante testada performou pior do que o modelo host não modificado, indicando uma limitação estrutural na projeção de pesos. Os resultados desafiam afirmações públicas sobre capacidades de modelos baseadas em benchmarks, mostrando que tais afirmações não refletem a geometria interna real dos pesos.

media Hugging Face Forums · há 10 d

The Clockwork Dark: Um Motor de RPG Narrativo Local-First com IA

The Clockwork Dark é um motor de RPG narrativo local-first, impulsionado por IA, que usa uma máquina de estados determinística para resolver todas as mecânicas do jogo. Ele apresenta dois LLMs autônomos que narram a história, com um atuando como uma voz paciente do mundo e o outro como um assistente divino e não confiável. O jogo oferece aos jogadores a escolha: lutar contra a corrupção sobrenatural iminente ou abraçar uma vida tranquila em uma padaria, sendo ambos os caminhos considerados finais válidos.

media Hugging Face Forums · há 10 d

Preso infinitamente em 'iniciando' com o container do Docker em execução

Um usuário relata que seu container do Docker com R/Shiny no rocker/r2u foi construído com sucesso e mostra 'Listening on http://0.0.0.0:7860' nos logs, mas o espaço permanece no estado 'starting' e é inacessível. O problema persiste apesar de não haver erros de código, e o usuário busca maior atenção, observando que pode ser um problema do lado da plataforma com a Hugging Face.

media Hugging Face Forums · há 10 d

Comparação de depuração em pequena escala do OLMo-core com enxerto Engram

Uma comparação de treinamento de 200 passos entre um modelo base OLMo3 600M e uma versão com enxerto Engram estilo DeepSeek mostra perda de treinamento e avaliação menores, estabilização mais rápida da norma do gradiente e comportamento de aprendizado inicial melhorado. O enxerto Engram, injetado nas camadas 1 e 5, aumenta os parâmetros treináveis para ~1,7B, mas mantém apenas um aumento de 40k nos parâmetros ativos por token, indicando uso eficiente de memória.

media Hugging Face Forums · há 10 d

LLMs como aceleradores epistêmicos: o risco não é apenas a alucinação

Os LLMs não apenas alucinam; eles amplificam a sobreconfiança epistêmica humana ao transformar hipóteses fracas em afirmações coerentes e polidas antes que as evidências sejam verificadas. Isso cria um risco de certeza prematura em pesquisa, políticas públicas e outros domínios, não porque os modelos mentem, mas porque aceleram as tendências humanas de favorecer explicações elegantes em vez da incerteza.