Um usuário pede orientação sobre como executar o servidor do llama.cpp com Gemma 4 E2B em um mini PC Intel N100 rodando Proxmox.

  • O hardware é um mini PC Intel N100.
  • A pilha de software inclui Proxmox e o servidor do llama.cpp.
  • O modelo alvo é Gemma 4 E2B para pequenas tarefas.
  • O usuário busca conselhos sobre se usar apenas a CPU ou a iGPU, e qual backend direcionar se usar a iGPU.