Пользователь Reddit запрашивает реальные данные о корпоративных развертываниях самостоятельного размещения искусственного интеллекта, проводя различие между фактическим производственным использованием и любительскими тестами.
- Одна общая модель с RAG или внедрением контекста
- Несколько меньших специализированных моделей
- Дообученные модели класса 70B
- Большие развертывания класса 405B
- Одна общая базовая модель с несколькими адаптерами
Запрос направлен на понимание основных причин, стоящих за этими архитектурными решениями, таких как стоимость, конфиденциальность, задержка, качество модели, соответствие требованиям, риски поставщиков или операционная простота.