Todos los artículos
blog Simon Willison · hace 9 d

sqlite-utils 4.0rc1 añade migraciones y transacciones anidadas

sqlite-utils 4.0rc1 introduce migraciones de base de datos y db.atomic() para transacciones anidadas. Las migraciones admiten cambios de esquema basados en scripts mediante una API simplificada, mientras que db.atomic() permite transacciones anidadas a través de puntos de guardado, mejorando el manejo de errores y la integridad de los datos. La versión incluye cambios incompatibles con versiones anteriores, como un comportamiento actualizado de upsert y la eliminación del soporte para Python 3.8, con opciones para mantener comportamientos antiguos.

media r/LocalLLaMA · hace 9 d

Qwen 27B para planificación, Qwen 35B-A3B para ejecución

Un usuario explora el uso de Qwen 27B para la planificación de tareas a largo plazo y Qwen 35B-A3B para una ejecución rápida, señalando que el modelo de 27B funciona a 7-10 tokens por segundo y el de 35B-A3B a ~18 tokens por segundo. El usuario considera alternar entre modelos para aprovechar sus diferentes fortalezas, aunque actualmente usa exclusivamente el 35B-A3B y cuestiona si la brecha de inteligencia entre los modelos es significativa.

media r/LocalLLaMA · hace 9 d

Resultados actualizados del benchmark de modelos de visión y recomendaciones

Un benchmark revisado de modelos de lenguaje visual locales evalúa 23 modelos en 30 imágenes con 3 pruebas cada una, totalizando 2.070 pruebas y entre 60 y 70 horas de inferencia. El modelo con mejor rendimiento es Qwen3.6 27B (nothink) en Q4 con una puntuación de 79.6, seguido por Qwen3.5 4B (nothink) en Q4, y Qwen3-VL 8B en Q8. Los hallazgos clave incluyen que el modo de pensamiento degrada el rendimiento visual, los modelos MoE tienen un rendimiento inferior en comparación con los modelos densos, y la cuantización Q8 no mejora universalmente los resultados.

media AI News (smol.ai) · hace 10 d

GLM-5.2 Destaca con un Avance y el Progreso de los Modelos Abiertos

El GLM-5.2 de Zhipu se consolidó como el modelo de peso abierto líder, elogiado por su rendimiento cercano a la vanguardia en el uso diario, con mejoras en tareas de codificación y reducción del costo de inferencia de 1M de tokens mediante IndexShare. Superó a otros modelos abiertos en benchmarks de trabajo de conocimiento agéntico, alcanzando 1266 Elo en la prueba AA-Briefcase de Artificial Analysis, aunque solo el 3% de las tareas fueron completamente satisfechas por los mejores modelos, lo que indica desafíos persistentes en el rendimiento de agentes a largo plazo en el mundo real.

media Hugging Face Forums · hace 10 d

¡Hallazgo importante para todos los que permanecen en el estado 'Iniciando'!

La interfaz de usuario de Hugging Face muestra incorrectamente espacios estancados en 'Iniciando', mientras que las operaciones del backend tienen éxito. Revisar los registros del contenedor revela una inicialización exitosa, lo que indica un error de sincronización del frontend. Los usuarios no deben modificar su código; el problema es un error de la interfaz de usuario a nivel de plataforma.

media AI News (smol.ai) · hace 10 d

GLM-5.2 surge como modelo de código líder de pesos abiertos

GLM-5.2 es ampliamente considerado el primer modelo de código de pesos abiertos que rivaliza con modelos de vanguardia como Opus 4.8 y GPT-5.5 en capacidad. Los profesionales destacan su fuerte uso de herramientas, planificación a largo plazo y comportamiento autónomo de subagentes, con consenso de que ahora opera de manera creíble en el rango de SWE de vanguardia. La aparición del modelo subraya el creciente valor de los pesos abiertos para la competencia entre proveedores, despliegue on-prem y reducción del bloqueo de proveedor.