Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 21

Kimi K2.7 Code está geralmente disponível no GitHub Copilot

O modelo Kimi K2.7 Code da Moonshot AI foi disponibilizado de forma geral na plataforma GitHub Copilot.

Usuário do Reddit pergunta se o Ubuntu é a distribuição Linux mais compatível para IA local

Um usuário da comunidade r/LocalLLaMA está migrando para o Linux e busca confirmação sobre se o Ubuntu oferece a melhor compatibilidade para executar cargas de trabalho de IA local.

media Hugging Face Forums · há 12 h

Suporte a caracteres Unicode em downloads do site

O site da Hugging Face não codifica corretamente caracteres Unicode ao baixar arquivos individuais de um conjunto de dados, seja pelo botão de download ou pela URL resolve.

media Hugging Face Forums · há 12 h

Agentes LLM podem desenvolver precognição?

O artigo argumenta que os agentes LLM atuais frequentemente agem com uma consciência implícita das consequências, o que é insuficiente para tarefas consequenciais. Propõe a "precognição explícita" como uma camada arquitetural necessária para garantir que os agentes modelam riscos e preveem efeitos antes da execução.

media Hugging Face Forums · há 12 h

Qual modelo de código aberto tem o melhor desempenho para agentes de suporte ao cliente?

Um usuário do fórum da Hugging Face está perguntando qual é o melhor modelo de IA gratuito para construir um chatbot ou assistente virtual de suporte ao cliente. A publicação não contém comparações específicas de modelos, resultados de testes ou detalhes técnicos.

media Hugging Face Forums · há 12 h

Erro no contador de downloads para modelos no Hugging Face

Um usuário no fórum da comunidade do Hugging Face relatou que as estatísticas de download para o repositório do modelo dele, InternScience/Agents-A1-FP8, permaneceram em zero apesar de terem sido enviadas dois dias antes. O usuário observa que o repositório inclui um arquivo config.json e suspeita que um problema técnico está impedindo a atualização do contador.

media Hugging Face Forums · há 12 h

Usuários relatam atraso na resposta do suporte de faturamento da Hugging Face

Um usuário no fórum de discussões da Hugging Face relata que seu e-mail ao suporte de faturamento sobre uma assinatura não autorizada não recebeu resposta. A pessoa está buscando um reembolso pela cobrança acidental e nota a falta de comunicação, apesar de já ter contactado a equipe de suporte.

media Hugging Face Forums · há 12 h

Melhores práticas para detectar e buscar deltas de conjuntos de dados

Um usuário no fórum da Hugging Face solicita métodos eficientes para detectar quando novos dados são adicionados ou um conjunto de dados é atualizado, com o objetivo de acionar pipelines sem reprocesar todo o conjunto de dados.

media r/LocalLLaMA · há 12 h

Bonsai-8B de 1 bit da PrismML supera IBM Granite em chamada de ferramentas na CPU com gramática

Uma avaliação do modelo Bonsai-8B de 1 bit da PrismML contra o IBM Granite e outros LLMs revela que o Bonsai-8B alcança a maior precisão na chamada de ferramentas ao usar decodificação restrita por gramática. O teste, conduzido na CPU usando llama.cpp, destaca o papel crítico das restrições de saída para permitir que modelos pequenos e quantizados funcionem eficazmente em tarefas de agentes.

media r/LocalLLaMA · há 12 h

Lemonade SDK lança RPG-HaloTales-V1 para role-playing multimídia local

O SDK da Lemonade lançou um novo modelo chamado RPG-HaloTales-V1, projetado para fornecer uma experiência de role-playing multimídia que os usuários podem executar localmente.

media r/LocalLLaMA · há 12 h

Backend de LLM local open-source para conversas entre NPCs

O autor lançou um backend de fala-para-fala totalmente local e de código aberto, projetado para NPCs de Modelos de Linguagem Grande que permite interações diretas entre NPC sem dependência de nuvem. O sistema integra componentes de fala-para-texto, um LLM local e texto-para-fala para permitir que os NPCs conversem entre si, retenham o contexto e influenciem as interações futuras com o jogador.

media r/LocalLLaMA · há 13 h

Melhor modelo de codificação para configuração com 3x Spark?

Um usuário está buscando recomendações para o melhor modelo de codificação para executar em uma configuração de hardware dedicada composta por três unidades Asus Ascent GX10 (GB10), esperando uma concorrência de 5 a 10 usuários.

media r/LocalLLaMA · há 13 h

Andi do Hugging Face demonstra um pipeline de voz totalmente open-source usando Gemma 4 31B

Andi do Hugging Face lançou uma demo totalmente open-source e gratuita que cria um pipeline de interação por voz. O sistema integra Nvidia parakeet, o modelo Gemma 4 31B servido pela Cerebras, e inferência personalizada para Qwen3TTS.

media r/LocalLLaMA · há 13 h

Z.ai lança ZCode para desafiar Cursor, Claude Code e GitHub Copilot na programação com IA

A Z.ai apresentou o ZCode, uma nova ferramenta de programação com IA projetada para competir com plataformas estabelecidas como Cursor, Claude Code e GitHub Copilot.

media r/LocalLLaMA · há 13 h

Atualização SimpleLLMChat 1.2.5 para IA Agêntica no Windows XP

O desenvolvedor lançou a versão 1.2.5 do SimpleLLMChat, uma estrutura de IA agêntica projetada para rodar em máquinas legadas usando Windows XP e .NET 4.0.

media r/LocalLLaMA · há 13 h

O que há no seu RAG?

Um usuário do Reddit questiona a utilidade prática da Geração Aumentada por Recuperação (RAG) para projetos pessoais envolvendo codificação, trabalho de sysadmin e pequenas bases de código. O autor argumenta que o conhecimento padrão da indústria já é bem coberto pelos modelos, enquanto fontes de dados específicas como bases de código ou referências de API são muito pequenas para exigir indexação ou grandes demais para serem gerenciadas eficientemente.

media r/LocalLLaMA · há 13 h

CEO da Palantir se enfurece contra modelos fechados

O CEO da Palantir, Alex Karp, criticou publicamente a Anthropic e a OpenAI por supostamente cobrar demais dos clientes e malutilizar seus dados. Essa posição surge enquanto a Palantir recentemente garantiu um acordo para comprar chips Nvidia para executar modelos locais para seus clientes empresariais.

media r/LocalLLaMA · há 13 h

Um truque barato para saída estruturada confiável: alimentar o erro de validação de volta na tentativa

Para melhorar a confiabilidade ao gerar saída estruturada de grandes modelos de linguagem, propõe-se um método que alimenta os erros de validação e a saída anterior do modelo de volta no prompt durante as tentativas. Esta abordagem transforma o processo de rolar respostas aleatórias novamente em autocorreção de erros específicos editando a tentativa anterior.

media Hugging Face Forums · há 18 h

Discrepância entre as vagas de ZeroGPU relatadas e os Espaços listados

Um usuário encontrou um erro de cota indicando que 17 vagas de ZeroGPU estavam em uso contra um limite de 10, apesar de apenas listar 8 Espaços solicitando o hardware zero-a10g.

media Hugging Face Forums · há 18 h

Usuário encontra SecretsInjectionError ao implantar SAM3 no Azure

Um usuário relata ter encontrado um SecretsInjectionError ao tentar implantar o modelo Meta SAM3 no Microsoft Azure usando o exemplo do Hugging Face Foundry. O erro ocorre durante a fase de configuração e instalação ao invocar a API implantada.