Todos os artigos — korshunov.ai

Todos os artigos Página 1 / 21

Compreender para participar

Geoffrey Litt argumenta que os desenvolvedores devem compreender profundamente o código gerado por agentes de codificação para evitar dívida cognitiva e permanecer participantes ativos no processo criativo.

media r/LocalLLaMA · há 4 h

OpenLumara agora conecta qualquer UI a modelos locais via endpoint da OpenAI

O framework de código aberto OpenLumara agora suporta conexão com qualquer interface de usuário que possa se comunicar com um endpoint da OpenAI, como KoboldLite e OpenWebUI. Esta atualização permite que os usuários integrem o harness eficiente em tokens em seus fluxos de trabalho existentes sem alterar seu frontend preferido.

media r/LocalLLaMA · há 4 h

Alguém está usando LLMs locais para geração em larga escala de dados espaciais ou layout de cidades em software como o QGIS?

Um usuário está buscando recomendações de modelos de linguagem locais capazes de gerar dados estruturais em larga escala, como layouts inteiros de cidades, redes rodoviárias e sistemas de grade complexos.

media r/LocalLLaMA · há 5 h

R9700 duplo: Melhor fórmula para Qwen3.6 27B?

Um usuário investiga a otimização do modelo Qwen3.6-27B em uma configuração com duas GPUs AMD Radeon R9700 usando llama.cpp, comparando o desempenho entre os backends Vulkan e ROCm.

media r/LocalLLaMA · há 6 h

Kernels WebGPU para Gemma 4 alcançam 255 tok/s

Xenova lançou kernels WebGPU para o Gemma 4, alcançando uma performance de 255 tokens por segundo. Esta otimização permite que modelos densos rodem a velocidades superiores a 100 tok/s em navegadores web.

blog Simon Willison · há 6 h

Usando DSPy para avaliar e melhorar os prompts do sistema SQL do Agente Datasette

Simon Willison utilizou o Claude Code com o modelo Fable 5 para automatizar a avaliação e otimização dos prompts do sistema para o Agente Datasette, focando especificamente em seu recurso de execução de consultas SQL apenas para leitura. O processo envolveu instalar a última versão alpha do Datasette e DSPy para identificar fraquezas na forma como o agente lida com informações de esquema.

media r/LocalLLaMA · há 6 h

Pioneiro de IA da Nvidia rejeita AGI e compara OpenAI e Anthropic à AOL

Uma figura proeminente da Nvidia afirmou que não acredita em Inteligência Geral Artificial (AGI) e argumenta que o foco da indústria deve mudar para modelos personalizados de código aberto para empresas.

media r/LocalLLaMA · há 10 h

Análise de 2,3k aplicativos de IA local revela 82 categorias e casos de uso diversos

Uma análise da Mac App Store identificou 2.259 aplicativos de IA local entre mais de 20.000 entradas raspadas, destacando um ecossistema crescente de ferramentas de nicho que empacotam modelos com fluxos de trabalho específicos. A pesquisa abrange 82 categorias distintas, desde tarefas comuns como transcrição e OCR até funções especializadas como estilismo de guarda-roupa e assistência à saúde de pets.

media r/LocalLLaMA · há 10 h

Gemma-4-31B ajustado para Copywriting com pontuação +290 Elo no EqBench3

Um usuário lançou um ajuste fino específico do modelo Gemma-4-31B-it, otimizado para tarefas de copywriting e escrita criativa. O modelo foi treinado para eliminar clichês genéricos de marketing e adotar um estilo de resposta direta, caracterizado por especificações concretas e chamadas à ação precisas.

media r/LocalLLaMA · há 11 h

Executando MiniMax M2.7 Q3 XL em 6 GPUs NVIDIA P40

Um usuário detalha o deploy bem-sucedido do modelo MiniMax M2.7 Q3_K_XL em seis GPUs NVIDIA Tesla P40, fornecendo uma configuração de hardware completa e configurações de inferência otimizadas para hospedagem local de LLM.

github llama.cpp · há 13 h

Lançamento b9860 do llama.cpp adiciona API llama_ftype_name

O projeto llama.cpp lançou a versão b9860, introduzindo uma nova função pública da API C chamada `llama_ftype_name` para expor o nome do tipo de arquivo do modelo (quantização).

media r/LocalLLaMA · há 13 h

Agentes estão escrevendo colaborativamente uma wiki massiva sobre RL para LLMs (mais de 200 artigos até agora) e qualquer um pode participar

Um projeto colaborativo está em andamento onde agentes de IA estão compilando uma wiki abrangente sobre aprendizado por reforço para grandes modelos de linguagem, já tendo processado mais de 200 artigos de pesquisa.

media r/LocalLLaMA · há 13 h

Postagem no Reddit insta a apreciar desenvolvedores de código aberto

Um usuário do Reddit destaca a necessidade crítica de gratidão para com os contribuidores de código aberto, citando as recentes atualizações rápidas do vLLM como um exemplo primoroso do esforço da comunidade.

media r/LocalLLaMA · há 13 h

Reconstruindo Gemma 4 31b... melhor... Como 26b...

Um desenvolvedor detalha um plano para reconstruir o modelo Gemma 4 31B reduzindo sua contagem de parâmetros para aproximadamente 26B, enquanto visa melhorar o desempenho. O projeto envolve mudanças arquiteturais, técnicas de treinamento específicas e curadoria de datasets para criar um modelo menor e mais eficiente.

media r/LocalLLaMA · há 13 h

poolside/Laguna-XS-2.1

O artigo anuncia o lançamento do Laguna-XS-2.1, um modelo disponível no Hugging Face sob a organização poolside.

media r/LocalLLaMA · há 13 h

Kimi K2.7 Code está geralmente disponível no GitHub Copilot

O modelo Kimi K2.7 Code da Moonshot AI foi disponibilizado de forma geral na plataforma GitHub Copilot.

media r/LocalLLaMA · há 15 h

Usuário do Reddit pergunta se o Ubuntu é a distribuição Linux mais compatível para IA local

Um usuário da comunidade r/LocalLLaMA está migrando para o Linux e busca confirmação sobre se o Ubuntu oferece a melhor compatibilidade para executar cargas de trabalho de IA local.

media Hugging Face Forums · há 15 h

Suporte a caracteres Unicode em downloads do site

O site da Hugging Face não codifica corretamente caracteres Unicode ao baixar arquivos individuais de um conjunto de dados, seja pelo botão de download ou pela URL resolve.

media Hugging Face Forums · há 15 h

Agentes LLM podem desenvolver precognição?

O artigo argumenta que os agentes LLM atuais frequentemente agem com uma consciência implícita das consequências, o que é insuficiente para tarefas consequenciais. Propõe a "precognição explícita" como uma camada arquitetural necessária para garantir que os agentes modelam riscos e preveem efeitos antes da execução.

media Hugging Face Forums · há 15 h

Qual modelo de código aberto tem o melhor desempenho para agentes de suporte ao cliente?

Um usuário do fórum da Hugging Face está perguntando qual é o melhor modelo de IA gratuito para construir um chatbot ou assistente virtual de suporte ao cliente. A publicação não contém comparações específicas de modelos, resultados de testes ou detalhes técnicos.