Todos los artículos
media r/LocalLLaMA · hace 13 d

Discrepancia entre el rendimiento de Llama Bench y el del mundo real

El usuario reporta una brecha significativa entre los resultados de las pruebas de Llama y el rendimiento real del modelo. Las pruebas muestran 754 tk/s de prefill y 36 tk/s de generación, pero el uso real revela solo 7.98 tokens por segundo, con alta latencia y bajo throughput. La discrepancia se atribuye a las condiciones de uso en el mundo real, no a la configuración de las pruebas, lo que sugiere que el rendimiento real del modelo está muy por debajo de la velocidad medida en las pruebas.

github llama.cpp · hace 13 d

llama.cpp libera b9700: nuevos binarios y actualizaciones de la API SYCL

La versión b9700 de llama.cpp introduce soporte SYCL actualizado con banderas de API renombradas: GGML_SYCL_SUPPORT_LEVEL_ZERO se ha renombrado a GGML_SYCL_SUPPORT_LEVEL_ZERO_API y GGML_SYCL_ENABLE_LEVEL_ZERO se ha renombrado a GGML_SYCL_USE_LEVEL_ZERO_API. La versión incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, ROCm, OpenVINO y SYCL.

media r/LocalLLaMA · hace 13 d

Keye-VL-2.0-30B-A3B se lanza con capacidades avanzadas de comprensión de video y agente

Keye-VL-2.0-30B-A3B es un modelo multimodal de 30B de parámetros diseñado para la comprensión de videos largos y funcionalidad de agente. Supera a los rivales de código abierto y iguala a Gemini-3-Flash en anclaje temporal, admite hasta 256K de contexto con razonamiento casi sin pérdida, e incluye capacidades integradas para flujos de trabajo de agentes de código, herramientas y búsqueda web.

github AutoGPT · hace 13 d

autogpt-platform-beta-v0.6.64 lanzado

La versión autogpt-platform-beta-v0.6.64, fechada el 18 de junio de 2026, introduce nuevas características como el Panel de Contexto de AutoPilot y Búsqueda Global, junto con mejoras en el guardado de gráficos, caché y rendimiento del constructor. También incluye endurecimiento de seguridad, corrección de errores relacionados con proveedores de LLM y mejoras en la interfaz de usuario, como un icono táctil de alta resolución.

media r/LocalLLaMA · hace 13 d

Reseña de GLM-5.2 y respuesta a la censura

GLM-5.2 demuestra una coherencia excepcional en contextos largos y fluidez conversacional, superando a Gemini-3.1-Pro en tareas solo de texto e igualando a GPT-5.5 en calidad de razonamiento. El modelo responde de manera factual a temas sensibles como Taiwán y la Plaza de Tiananmén, proporcionando contexto histórico detallado sin censura explícita, aunque se adhiere a las directrices de contenido del gobierno chino.

media Latent Space · hace 13 d

Midjourney lanza un escáner de ultrasonido y TC de cuerpo completo

Midjourney ha anunciado un escáner de ultrasonido y TC de cuerpo completo, calificándolo como la primera nueva modalidad de imagen médica de cuerpo entero en 50 años. El prototipo, conocido como Midjourney Scanner, utiliza 8.960 transductores distribuidos en 40 sistemas dentro de un anillo de 70 cm para capturar datos a 17 GB/s, con una resolución declarada de hasta 0,5 mm y un objetivo de 358.000 elementos ultrasónicos. El sistema se encuentra actualmente en la Gen 1, con escaneos que toman 20 minutos y sin uso de IA en la generación de imágenes aún, aunque las futuras versiones buscan integrar IA y alcanzar 50.000 escáneres al permitir 1.000 millones de escaneos mensuales.