Wecko-ai publica conjunto de dados aberto mapeando LLMs locais para níveis de RAM

Um desenvolvedor publicou no GitHub um conjunto de dados aberto detalhando quais modelos de linguagem grande (LLM) locais cabem em níveis específicos de RAM e VRAM, variando de 8 GB a 128 GB. O projeto aborda a dificuldade comum de determinar a compatibilidade do modelo com hardware como um MacBook de 16 GB ou NVIDIA RTX 3060.

O conjunto de dados inclui 62 modelos com detalhes sobre quantização, tamanho de carregamento e comandos do Ollama. Ele fornece uma regra prática: os modelos Q4_K_M requerem aproximadamente 0,6 GB de memória por bilhão de parâmetros, sugerindo dimensionar para cerca de 70% da RAM disponível para sobrecarga do sistema. Os dados cobrem orçamentos utilizáveis e contagens máximas de parâmetros para níveis incluindo 8 GB (~8B params), 16 GB (~14B), 24 GB (~27B), 32 GB (~35B), 48 GB (~47B), 64 GB (~70B) e 128 GB (~122B).

O conjunto de dados está disponível sob licença CC BY com uma API JSON para acesso programático, cobrindo Apple Silicon e hardware NVIDIA de consumo. O autor convida contribuições da comunidade para corrigir erros ou adicionar modelos e quantizações faltantes.