Um usuário do Reddit questiona se é viável executar uma quantização razoável do modelo Qwen 3.6 35B A3B, ou potencialmente Ornith/3.5, em um laptop equipado com 32GB de RAM LPDDR5 e GPU RTX 5060.

  • O usuário observa que o laptop tem 32GB de memória LPDDR5 rodando a 7500 MT/s, oferecendo maior largura de banda do que a DDR5 padrão.
  • O hardware inclui uma GPU para laptop RTX 5060, descrita como semelhante à sua contraparte de desktop.
  • O usuário reconhece que, embora a arquitetura 35B A3B seja capaz para seu tamanho, ele antecipa possíveis limitações de contexto ou cache KV durante o uso.