Un usuario reporta frustración con la configuración de resolución de imagen predeterminada de Gemma 4, señalando que el modelo tiene dificultades para descifrar texto más pequeño y elementos composicionales más grandes en comparación con competidores como Qwen 3.6.
- El usuario intentó ajustar parámetros en LlamaCpp (`--image-min-tokens 560 --image-max-tokens 2240`) para mejorar el rendimiento.
- Aplicar estos límites específicos de tokens provocó que el servidor se bloqueara y cerrara en lugar de mejorar las capacidades de visión.
- El usuario busca un método para aumentar la resolución de imagen de Gemma 12b para que funcione como un asistente integral.