Wecko-ai publie un jeu de données ouvert mappant les LLM locaux aux niveaux de RAM

Un développeur a publié sur GitHub un jeu de données ouvert détaillant quels modèles de langage large (LLM) locaux s'inscrivent dans des niveaux spécifiques de RAM et VRAM, allant de 8 Go à 128 Go. Le projet répond à la difficulté courante de déterminer la compatibilité des modèles pour du matériel tel qu'un MacBook de 16 Go ou un NVIDIA RTX 3060.

Le jeu de données comprend 62 modèles avec des détails sur la quantification, la taille de chargement et les commandes Ollama. Il fournit une règle empirique selon laquelle les modèles Q4_K_M nécessitent environ 0,6 Go de mémoire par milliard de paramètres, suggérant de dimensionner à environ 70 % de la RAM disponible pour les besoins du système. Les données couvrent les budgets utilisables et les nombres maximums de paramètres pour des niveaux incluant 8 Go (~8 milliards de paramètres), 16 Go (~14 milliards), 24 Go (~27 milliards), 32 Go (~35 milliards), 48 Go (~47 milliards), 64 Go (~70 milliards) et 128 Go (~122 milliards).

Le jeu de données est disponible sous licence CC BY avec une API JSON pour un accès programmatique, couvrant le matériel Apple Silicon et NVIDIA grand public. L'auteur invite la communauté à contribuer pour corriger les erreurs ou ajouter des modèles et des quantifications manquants.