Un utilisateur demande des conseils pour exécuter le serveur llama.cpp avec Gemma 4 E2B sur un mini PC Intel N100 fonctionnant sous Proxmox.

  • Le matériel est un mini PC Intel N100.
  • La pile logicielle comprend Proxmox et le serveur llama.cpp.
  • Le modèle cible est Gemma 4 E2B pour des tâches de petite taille.
  • L'utilisateur cherche des conseils sur s'il doit utiliser uniquement le CPU ou l'iGPU, et quel backend cibler s'il utilise l'iGPU.