Цены на модели OpenRouter указывают на значительное квантование моделей, поскольку стоимость прямого выполнения превышает цены на API без высокой пропускной способности или оптимизированного обслуживания. Автор утверждает, что без значительного повышения эффективности или предоставления премиальных, высококачественных доступов, квантование, вероятно, снижает качество выводов — особенно в сложных задачах, таких как планирование и программирование — что вызывает опасения по поводу прозрачности и доступа к истинной способности моделей.
Цены на модели OpenRouter указывают на более глубокую квантование
Переведено с English → Русский