Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 20

Lemonade SDK lança RPG-HaloTales-V1 para role-playing multimídia local

O SDK da Lemonade lançou um novo modelo chamado RPG-HaloTales-V1, projetado para fornecer uma experiência de role-playing multimídia que os usuários podem executar localmente.

media r/LocalLLaMA · há 9 h

Backend de LLM local open-source para conversas entre NPCs

O autor lançou um backend de fala-para-fala totalmente local e de código aberto, projetado para NPCs de Modelos de Linguagem Grande que permite interações diretas entre NPC sem dependência de nuvem. O sistema integra componentes de fala-para-texto, um LLM local e texto-para-fala para permitir que os NPCs conversem entre si, retenham o contexto e influenciem as interações futuras com o jogador.

media r/LocalLLaMA · há 10 h

Melhor modelo de codificação para configuração com 3x Spark?

Um usuário está buscando recomendações para o melhor modelo de codificação para executar em uma configuração de hardware dedicada composta por três unidades Asus Ascent GX10 (GB10), esperando uma concorrência de 5 a 10 usuários.

media r/LocalLLaMA · há 10 h

Andi do Hugging Face demonstra um pipeline de voz totalmente open-source usando Gemma 4 31B

Andi do Hugging Face lançou uma demo totalmente open-source e gratuita que cria um pipeline de interação por voz. O sistema integra Nvidia parakeet, o modelo Gemma 4 31B servido pela Cerebras, e inferência personalizada para Qwen3TTS.

media r/LocalLLaMA · há 10 h

Z.ai lança ZCode para desafiar Cursor, Claude Code e GitHub Copilot na programação com IA

A Z.ai apresentou o ZCode, uma nova ferramenta de programação com IA projetada para competir com plataformas estabelecidas como Cursor, Claude Code e GitHub Copilot.

media r/LocalLLaMA · há 10 h

Atualização SimpleLLMChat 1.2.5 para IA Agêntica no Windows XP

O desenvolvedor lançou a versão 1.2.5 do SimpleLLMChat, uma estrutura de IA agêntica projetada para rodar em máquinas legadas usando Windows XP e .NET 4.0.

media r/LocalLLaMA · há 10 h

O que há no seu RAG?

Um usuário do Reddit questiona a utilidade prática da Geração Aumentada por Recuperação (RAG) para projetos pessoais envolvendo codificação, trabalho de sysadmin e pequenas bases de código. O autor argumenta que o conhecimento padrão da indústria já é bem coberto pelos modelos, enquanto fontes de dados específicas como bases de código ou referências de API são muito pequenas para exigir indexação ou grandes demais para serem gerenciadas eficientemente.

media r/LocalLLaMA · há 10 h

CEO da Palantir se enfurece contra modelos fechados

O CEO da Palantir, Alex Karp, criticou publicamente a Anthropic e a OpenAI por supostamente cobrar demais dos clientes e malutilizar seus dados. Essa posição surge enquanto a Palantir recentemente garantiu um acordo para comprar chips Nvidia para executar modelos locais para seus clientes empresariais.

media r/LocalLLaMA · há 10 h

Um truque barato para saída estruturada confiável: alimentar o erro de validação de volta na tentativa

Para melhorar a confiabilidade ao gerar saída estruturada de grandes modelos de linguagem, propõe-se um método que alimenta os erros de validação e a saída anterior do modelo de volta no prompt durante as tentativas. Esta abordagem transforma o processo de rolar respostas aleatórias novamente em autocorreção de erros específicos editando a tentativa anterior.

media Hugging Face Forums · há 16 h

Discrepância entre as vagas de ZeroGPU relatadas e os Espaços listados

Um usuário encontrou um erro de cota indicando que 17 vagas de ZeroGPU estavam em uso contra um limite de 10, apesar de apenas listar 8 Espaços solicitando o hardware zero-a10g.

media Hugging Face Forums · há 16 h

Usuário encontra SecretsInjectionError ao implantar SAM3 no Azure

Um usuário relata ter encontrado um SecretsInjectionError ao tentar implantar o modelo Meta SAM3 no Microsoft Azure usando o exemplo do Hugging Face Foundry. O erro ocorre durante a fase de configuração e instalação ao invocar a API implantada.

media Hugging Face Forums · há 16 h

NanoI2V: Construindo um modelo de Imagem para Vídeo do zero

O NanoI2V é um projeto de código aberto que implementa um modelo de geração de imagem para vídeo do zero, com o objetivo de fornecer uma referência limpa e educacional para técnicas modernas de geração de vídeo. O repositório prioriza a legibilidade e a reprodutibilidade em vez da complexidade encontrada na maioria dos projetos de ponta.

media Hugging Face Forums · há 16 h

Como publicar minha pesquisa no HuggingFace?

Um usuário do fórum da Hugging Face busca orientação sobre como publicar adequadamente seu projeto de pesquisa, TIS (Token Importance Scoring), junto com seu código e documentação associados.

github Goose (Block) · há 16 h

Notas de Lançamento do Goose v1.40.0

A atualização Goose v1.40.0 introduz suporte extensivo à localização para o aplicativo desktop, adicionando idiomas para francês, alemão, italiano, português, indonésio, malaio, vietnamita, chinês tradicional, coreano, japonês, espanhol e hindi.

media Hugging Face Forums · há 19 h

Context Gravity

Chris Diaz compartilhou um novo projeto chamado Context Gravity, que está disponível no GitHub. O autor está buscando feedback da comunidade sobre o repositório.

media Hugging Face Forums · há 21 h

Mostrar HF: ServBay, um Runtime & Gateway de IA Local-First para Agentes de Codificação

O ServBay é apresentado como uma solução de runtime e infraestrutura local-first projetada para preencher a lacuna entre agentes de codificação de IA e a máquina host do usuário. Ele aborda o problema da "última milha", onde agentes inteligentes carecem de capacidades em nível de sistema para configurar bancos de dados, domínios ou certificados SSL sem intervenção manual do desenvolvedor.

media Hugging Face Forums · há 21 h

Prism Transformer: Agendamentos Progressivos de Cabeças para Processamento de Atenção Hierárquica

O Prism Transformer introduz um agendamento progressivo de cabeças que varia o número de cabeças de atenção entre as camadas, começando com menos cabeças mais largas nas camadas iniciais e aumentando a contagem monotonicamente com a profundidade. Esta abordagem desafia a alocação uniforme padrão ao atender às necessidades estruturais distintas das camadas iniciais versus tardias sem adicionar sobrecarga arquitetural.

github CrewAI · há 21 h

Notas de lançamento do LangChain v1.15.2a2

Esta versão atualiza o LangChain com novos recursos para integração com Bedrock, documentação do agente de fluxo e navegação em streaming, além de correções de bugs e melhorias na documentação.

media Hugging Face Forums · há 22 h

Sonho Fractal + Planejamento Inspirado em Quântica: Uma Ferramenta de Descoberta de Conhecimento Auto-organizada com DeepSeek Coder

O autor apresenta uma ferramenta de descoberta de conhecimento auto-organizada que integra a geração de padrões fractais e superposição inspirada na mecânica quântica para aprimorar a exploração de espaços de conhecimento do DeepSeek Coder. O sistema otimiza as trajetórias de busca armazenando caminhos criativos bem-sucedidos como consultas em cache, em vez de memória, adaptando o uso de recursos com base nas limitações de hardware.

media Hugging Face Forums · há 22 h

Wmf: uma nova técnica experimental

O conteúdo do artigo foi removido pelo autor, não deixando informações substanciais sobre a técnica.