Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 19

Todos começamos em algum lugar

Um desenvolvedor com mais de 25 anos de experiência em tecnologias web está migrando para a engenharia de IA para ir além do uso de ferramentas e entender como construí-las.

media Hugging Face Forums · há 3 d

Usuário não consegue reiniciar Espaço privado do Hugging Face devido a erro 503

Um usuário relata que seu Espaço privado do Hugging Face, especificamente 'Ark-kun/tangent', parou de funcionar abruptamente e não pode ser reiniciado. As tentativas de reiniciar ou realizar uma reconstrução de fábrica falham com o erro "503. Algo deu errado ao reiniciar este Espaço".

github llama.cpp · há 3 d

Lançamento b9840 do llama.cpp adiciona suporte ao DeepSeek V4 e binários multiplataforma

O lançamento b9840 do llama.cpp introduz suporte à conversão para o modelo DeepSeek V4, incluindo tratamento específico para a variante Pro. Esta atualização integra a nova arquitetura na biblioteca junto com várias otimizações internas e correções de bugs.

lab OpenAI News · há 3 d

Mapeando a Oportunidade da Força de Trabalho de IA na Europa

A OpenAI Economic Research estendeu seu Framework de Transição de Empregos de IA à União Europeia, utilizando a taxonomia ESCO e dados do Eurostat para analisar como as capacidades de IA podem remodelar os mercados de trabalho em todos os estados-membros.

github llama.cpp · há 3 d

Lançamento b9839 do llama.cpp com correção de varredura Tailwind e binários multiplataforma

O projeto llama.cpp lançou a versão b9839, que inclui uma correção para restaurar a varredura Tailwind em worktrees ignorados. Esta atualização fornece binários pré-compilados para macOS, Linux, Android, Windows e openEuler em várias arquiteturas e backends de aceleração de hardware.

github llama.cpp · há 3 d

Lançamento b9838 do llama.cpp: Builds para macOS, Linux, Windows e Android

O projeto llama.cpp lançou a versão b9838, fornecendo binários pré-compilados para uma ampla gama de sistemas operacionais e aceleradores de hardware. Este lançamento inclui suporte para CPU, GPU (CUDA, Vulkan, ROCm, OpenCL) e aceleradores de IA especializados em macOS, Linux, Windows, Android e openEuler.

media Hugging Face Forums · há 3 d

A Arquitetura de Contexto Geracional: Resolvendo a Degradação do Contexto em LLMs

A Arquitetura de Contexto Geracional (GCA) propõe tratar a janela de contexto de um LLM como uma vida útil finita, em vez de armazenamento infinito, para resolver a "degradação do contexto" e a diluição da atenção em sistemas multiagente. Ao impor mortalidade artificial, os agentes são encerrados antes que o desempenho se degrade, transferindo seu estado para novas gerações por meio de um cofre Markdown em arquivo plano.

media Hugging Face Forums · há 3 d

Análise da dinâmica de estados ocultos em 7 LLMs de peso aberto revela padrões funcionais recorrentes

Um pesquisador independente analisou a evolução das representações ocultas durante a inferência em sete modelos de peso aberto, incluindo GPT-2, OPT-125M e Llama-3.2-1B, para identificar regimes dinâmicos internos além dos benchmarks de saída padrão.

media Hugging Face Forums · há 3 d

Explorando Regimes Funcionais Dentro de Modelos de Linguagem Pequenos

Este projeto de pesquisa independente caracteriza a dinâmica interna de sete modelos de linguagem pequenos e médios analisando como as representações ocultas evoluem durante a inferência, em vez de depender de benchmarks de saída padrão. O estudo investiga o comportamento dinâmico, a organização funcional e a geometria da representação para identificar padrões reproduzíveis entre diferentes arquiteturas.

media Hugging Face Forums · há 3 d

Previsor da Copa do Mundo de 2026

Um desenvolvedor criou uma ferramenta de previsão da Copa do Mundo de 2026 que usa dados históricos para simular os resultados do torneio. O aplicativo fornece probabilidades de vitória e previsões de placar para quaisquer duas seleções nacionais com base em padrões aprendidos a partir de aproximadamente 50.000 partidas internacionais abrangendo mais de um século.

media Hugging Face Forums · há 3 d

Um guia abrangente e bilíngue para Transformers: Dos fundamentos à compressão de KV-cache e dinâmica de atenção

Carles Marin lançou um guia open-source, bilíngue (inglês e espanhol), que conecta as bases matemáticas das arquiteturas Transformer com sua implementação prática. O recurso foca em mecânicas de baixo nível, fornecendo código reproduzível e elementos interativos para explicar tópicos complexos.

media Hugging Face Forums · há 3 d

Guia bilingue de código aberto sobre mecânica do Transformer publicado

Um guia bilingue (inglês/espanhol) de código aberto detalhando o funcionamento interno dos Transformers foi publicado. O recurso cobre a matemática exata e a mecânica por trás de conceitos como colapso de atenção e compressão de KV-cache.

lab OpenAI News · há 4 d

HP Inc. lança parceria estratégica Frontier com a OpenAI

A HP Inc. está ampliando sua parceria estratégica com a OpenAI após pilotos bem-sucedidos, implementando IA em experiências do cliente, produtividade dos funcionários e desenvolvimento de software. A empresa utiliza a plataforma OpenAI Frontier como um modelo operacional unificado para governar contexto, permissões e avaliação à medida que avança de casos de uso experimentais para produção em toda a empresa.

github llama.cpp · há 4 d

Lançamento do llama.cpp b9837 adiciona sinalizador --reasoning-preserve e novos binários

O projeto llama.cpp lançou a versão b9837, que introduz um novo sinalizador `--reasoning-preserve` para o modelo de chat Jinja, a fim de reter tokens de raciocínio. Esta atualização também inclui mensagens de ajuda corrigidas e fornece binários pré-compilados para macOS, Linux, Windows, Android e openEuler em vários backends de hardware.

media Hugging Face Forums · há 4 d

HoLo-ToLk: Modelos de fala sem tokenizador em substrato HSL de 0 parâmetros

O autor apresenta o HoLo-ToLk, um projeto de pesquisa que constrói modelos de fala-para-texto (STT) e texto-para-fala (TTS) usando o substrato de bytes HSL de zero parâmetros sem tokenizadores ou embeddings de entrada aprendidos. O trabalho demonstra que os bytes brutos do HSL podem servir como um sinal viável para processamento de áudio quando combinados com modificações arquiteturais específicas.

github llama.cpp · há 4 d

Lançamento b9835 do llama.cpp com correções de parada na interface e pulso de raciocínio

O projeto llama.cpp lançou a versão b9835, que inclui uma correção para a funcionalidade de parada e pulso de raciocínio no modo de modelo único. Esta atualização aborda problemas específicos dentro da interface do usuário para melhorar o controle durante a inferência do modelo.

media Hugging Face Forums · há 4 d

Investigação Hipotética sobre o Aprendizado de Código Binário por IA

Um usuário do fórum faz uma pergunta especulativa sobre se treinar redes neurais ou sistemas de IA para entender código binário melhoraria significativamente suas capacidades gerais, particularmente em tarefas de programação.

media Hugging Face Forums · há 4 d

Conceito: Trocar dados por dados para treinar modelos de IA

Um usuário propõe um conceito para um site onde indivíduos trocam dados por dados para treinar modelos de IA, eliminando a necessidade de transações monetárias. O sistema opera em uma economia baseada em créditos, onde os usuários começam com uma quantidade definida de créditos e publicam recompensas por necessidades específicas de dados.

github llama.cpp · há 4 d

Lançamento b9833 do llama.cpp: Parser para MiniCPM5 e binários multi-plataforma

O projeto llama.cpp lançou a versão b9833, introduzindo um parser dedicado para o modelo MiniCPM5 junto com várias correções de bugs e refatorações. Esta atualização inclui suporte para parsing de chamadas de ferramenta, simplificação de gramática e correção do comportamento da API Jinja para garantir compatibilidade com os padrões Jinja2.

github llama.cpp · há 4 d

Lançamento b9832 do llama.cpp adiciona flag de depuração --dump-prog

O projeto llama.cpp lançou a versão b9832, introduzindo uma nova opção de linha de comando `--dump-prog` para o mecanismo de template Jinja, visando auxiliar na depuração. Esta atualização também inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler em várias arquiteturas de CPU e GPU.