Пользователь Reddit отмечает, что интерес к дообучению моделей на оборудовании потребительского класса, похоже, снизился после выпуска способных универсальных моделей, таких как Llama-3-8b. Автор предполагает, что повышение интеллекта базовой модели снижает необходимость в дообучении, поскольку часто достаточно промпт-инжиниринга.

  • Воспринимаемое снижение активности сообщества совпадает с эпохой более умных базовых моделей после выхода Llama-3-8b.
  • Уточнение промптов указывается как достаточная альтернатива дообучению при использовании достаточно мощных базовых архитектур.
  • Автор подозревает, что активные сообщества обучения всё ещё существуют, но менее заметны на сабреддите.

Пост подчеркивает сдвиг в поведении пользователей, где улучшенные возможности базовой модели могут снижать зависимость от локальных рабочих процессов дообучения.