Un utilisateur de Reddit se demande s'il est réalisable d'exécuter une quantisation raisonnable du modèle Qwen 3.6 35B A3B, ou potentiellement Ornith/3.5, sur un ordinateur portable équipé de 32 Go de RAM LPDDR5 et d'un GPU RTX 5060.

  • L'utilisateur note que l'ordinateur portable dispose de 32 Go de mémoire LPDDR5 fonctionnant à 7500 MT/s, offrant une bande passante supérieure à celle de la DDR5 standard.
  • Le matériel comprend un GPU laptop RTX 5060, décrit comme similaire à sa contrepartie desktop.
  • L'utilisateur reconnaît que bien que l'architecture 35B A3B soit capable pour sa taille, il anticipe des limitations potentielles de contexte ou de cache KV lors de l'utilisation.