Пользователь Reddit запрашивает реальные данные о корпоративных развертываниях самостоятельного размещения искусственного интеллекта, проводя различие между фактическим производственным использованием и любительскими тестами.

  • Одна общая модель с RAG или внедрением контекста
  • Несколько меньших специализированных моделей
  • Дообученные модели класса 70B
  • Большие развертывания класса 405B
  • Одна общая базовая модель с несколькими адаптерами

Запрос направлен на понимание основных причин, стоящих за этими архитектурными решениями, таких как стоимость, конфиденциальность, задержка, качество модели, соответствие требованиям, риски поставщиков или операционная простота.