Um desenvolvedor publicou no GitHub um conjunto de dados aberto detalhando quais modelos de linguagem grande (LLM) locais cabem em níveis específicos de RAM e VRAM, variando de 8 GB a 128 GB. O projeto aborda a dificuldade comum de determinar a compatibilidade do modelo com hardware como um MacBook de 16 GB ou NVIDIA RTX 3060.

O conjunto de dados inclui 62 modelos com detalhes sobre quantização, tamanho de carregamento e comandos do Ollama. Ele fornece uma regra prática: os modelos Q4_K_M requerem aproximadamente 0,6 GB de memória por bilhão de parâmetros, sugerindo dimensionar para cerca de 70% da RAM disponível para sobrecarga do sistema. Os dados cobrem orçamentos utilizáveis e contagens máximas de parâmetros para níveis incluindo 8 GB (~8B params), 16 GB (~14B), 24 GB (~27B), 32 GB (~35B), 48 GB (~47B), 64 GB (~70B) e 128 GB (~122B).

O conjunto de dados está disponível sob licença CC BY com uma API JSON para acesso programático, cobrindo Apple Silicon e hardware NVIDIA de consumo. O autor convida contribuições da comunidade para corrigir erros ou adicionar modelos e quantizações faltantes.