La fijación de precios de los modelos de OpenRouter sugiere una cuantización significativa, ya que los costos de inferencia sin procesar superan los precios de la API sin un alto rendimiento o un servicio optimizado. El autor argumenta que, a menos que los proveedores logren una eficiencia mucho mejor o ofrezcan acceso premium y de alta fidelidad, es probable que la cuantización degrade la calidad de salida, especialmente en tareas complejas como la planificación y la programación, lo que genera preocupaciones sobre la transparencia y el acceso a la verdadera capacidad del modelo.
Los precios de los modelos de OpenRouter implican una cuantización más pesada
Traducido del English → Español