Un usuario de Reddit señala que el interés en ajustar modelos en hardware de grado consumidor parece haber disminuido desde el lanzamiento de modelos generalistas capaces como Llama-3-8b. El autor sugiere que la mejora en la inteligencia del modelo base reduce la necesidad de ajuste fino, ya que la ingeniería de prompts suele ser suficiente.
- La caída percibida en la actividad de la comunidad coincide con la era posterior a Llama-3-8b de modelos base más inteligentes.
- Se cita el ajuste de prompts como una alternativa suficiente al ajuste fino cuando se utilizan arquitecturas base suficientemente capaces.
- El autor sospecha que las comunidades activas de entrenamiento aún existen pero son menos visibles en el subreddit.
La publicación destaca un cambio en el comportamiento del usuario donde las capacidades mejoradas del modelo base pueden estar reduciendo la dependencia de los flujos de trabajo de ajuste fino local.