Un usuario pide orientación sobre cómo ejecutar el servidor de llama.cpp con Gemma 4 E2B en una mini PC Intel N100 que ejecuta Proxmox.

  • El hardware es una mini PC Intel N100.
  • La pila de software incluye Proxmox y el servidor de llama.cpp.
  • El modelo objetivo es Gemma 4 E2B para tareas pequeñas.
  • El usuario busca consejos sobre si usar solo la CPU o la iGPU, y qué backend dirigir si se usa la iGPU.