Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 130

Disponibilidad de la versión local de Le Chaton Fat Flash

Los usuarios muestran interés en una versión local "flash" de Le Chaton Fat por privacidad y soberanía. La comunidad está pidiendo actualizaciones sobre cuándo estará disponible dicha versión ligera local.

github llama.cpp · hace 13 d

LLaMA.cpp Release b9698 Adds Self-Update Support and Multiple Platform Binaries

La versión b9698 de LLaMA.cpp habilita las actualizaciones automáticas únicamente cuando se compila con llama-install.sh. La versión incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración de hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 13 d

llama.cpp Release b9699 Adds SYCL Support and Multiple Platform Binaries

La versión b9699 de llama.cpp introduce soporte para las operaciones MUL_MAT y OUT_PROD con precisión Q1_0 a través del PR #24721. El lanzamiento incluye binarios precompilados para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y marcos de aceleración, incluyendo SYCL (FP32 y FP16), Vulkan, CUDA, ROCm y OpenVINO.

media r/LocalLLaMA · hace 13 d

Modelos de ML recomendados para MacBook Pro con chip M5 Max y 128GB de RAM

El usuario solicita recomendaciones de modelos para su MacBook Pro de 16 pulgadas con chip M5 Max y 128GB de RAM. Actualmente ejecuta Qwen 3.6 35B a3b a través del agente Hermes y LM Studio, señalando la idoneidad de los modelos MLX en Apple Silicon.

media r/LocalLLaMA · hace 13 d

Keye-VL-2.0-30B-A3B se lanza con capacidades avanzadas de comprensión de video y agente

Keye-VL-2.0-30B-A3B es un modelo multimodal de 30B de parámetros diseñado para la comprensión de videos largos y funcionalidad de agente. Supera a los rivales de código abierto y iguala a Gemini-3-Flash en anclaje temporal, admite hasta 256K de contexto con razonamiento casi sin pérdida, e incluye capacidades integradas para flujos de trabajo de agentes de código, herramientas y búsqueda web.

github llama.cpp · hace 13 d

LLaMA.cpp lanza b9697: nuevos binarios y actualizaciones

LLaMA.cpp publica la versión b9697 con binarios actualizados para macOS, Linux, Android, Windows y openEuler. La publicación incluye soporte para ARM64, x64, Vulkan, CUDA 12 y 13, OpenVINO, SYCL y ROCm, junto con la corrección de un problema de análisis de mensajes en las comprobaciones de lanzamiento.

media r/LocalLLaMA · hace 13 d

Fecha de lanzamiento de GLM-5.2 Flash (broma)

Un usuario de Reddit bromea sobre la apertura del código de GLM-5.2 por parte de Z.ai, expresando entusiasmo por un sucesor de GLM-4.7-flash. La publicación sugiere humorísticamente que un modelo en el rango de 27-120B parámetros sería ideal, aunque se presenta como una broma.

github AutoGPT · hace 13 d

autogpt-platform-beta-v0.6.64 lanzado

La versión autogpt-platform-beta-v0.6.64, fechada el 18 de junio de 2026, introduce nuevas características como el Panel de Contexto de AutoPilot y Búsqueda Global, junto con mejoras en el guardado de gráficos, caché y rendimiento del constructor. También incluye endurecimiento de seguridad, corrección de errores relacionados con proveedores de LLM y mejoras en la interfaz de usuario, como un icono táctil de alta resolución.

github CrewAI · hace 13 d

CrewAI v1.14.8a lanza nuevas funciones de FlowDefinition

CrewAI v1.14.8a introduce acciones de script y tripulación en FlowDefinition, añade soporte para modo DMN y permite la ejecución de flujos sin código Python. También incluye soporte experimental para tripulaciones JSON-first y fallback de despliegue ZIP, junto con una mejor reinicialización de memoria y seguimiento del uso de tokens.

media r/LocalLLaMA · hace 13 d

¿Alguien tiene suficiente capacidad de cómputo para crear un conjunto de datos de destilación a partir de GLM5.2?

Un usuario pregunta si alguien con recursos informáticos suficientes puede crear un gran conjunto de datos de destilación de 70-1 millones de ejemplos a partir de GLM5.2. El objetivo es permitir un mejor entrenamiento de modelos más pequeños como Qwen3.5, beneficiando a la comunidad en general.

github llama.cpp · hace 13 d

llama.cpp Release b9693 Adds BF16 Support and Cross-Platform Binaries

La versión b9693 de llama.cpp introduce soporte para BF16 en su kernel de concatenación y proporciona binarios precompilados para macOS, Linux, Android, Windows y openEuler. La versión incluye variantes para CPU, Vulkan, ROCm, OpenVINO, SYCL e HIP en múltiples arquitecturas, con un paquete de interfaz de usuario dedicado disponible.

github llama.cpp · hace 13 d

llama.cpp lanza la versión b9694 con nuevos binarios para múltiples plataformas

llama.cpp ha lanzado la versión b9694, que incluye binarios para macOS, Linux, Android, Windows y openEuler. La versión es compatible con varias arquitecturas y opciones de aceleración como CUDA, Vulkan, OpenVINO, SYCL y ROCm. También se implementó una corrección para el enlace de la versión de OpenVINO en Windows x64.

media r/LocalLLaMA · hace 13 d

LocalLLaMA propone un conjunto de datos de programación colaborativo

Una iniciativa comunitaria sugiere crear un conjunto de datos de programación colaborativo para habilitar el desarrollo de LLMs locales. La propuesta busca permitir que cualquier persona con hardware pueda contribuir con datos, mientras que usuarios con mayor capacidad ayuden a ajustar o cuantificar modelos, reduciendo así la dependencia de los modelos publicados por las empresas.

media r/LocalLLaMA · hace 14 d

¿En qué has estado trabajando últimamente?

Un usuario de Reddit le pregunta a la comunidad sobre sus proyectos recientes, señalando que mientras las discusiones se centran en herramientas, hay poca información sobre las aplicaciones reales o el trabajo que se está realizando con esas herramientas.

media r/LocalLLaMA · hace 14 d

Reseña de GLM-5.2 y respuesta a la censura

GLM-5.2 demuestra una coherencia excepcional en contextos largos y fluidez conversacional, superando a Gemini-3.1-Pro en tareas solo de texto e igualando a GPT-5.5 en calidad de razonamiento. El modelo responde de manera factual a temas sensibles como Taiwán y la Plaza de Tiananmén, proporcionando contexto histórico detallado sin censura explícita, aunque se adhiere a las directrices de contenido del gobierno chino.

media Latent Space · hace 14 d

Midjourney lanza un escáner de ultrasonido y TC de cuerpo completo

Midjourney ha anunciado un escáner de ultrasonido y TC de cuerpo completo, calificándolo como la primera nueva modalidad de imagen médica de cuerpo entero en 50 años. El prototipo, conocido como Midjourney Scanner, utiliza 8.960 transductores distribuidos en 40 sistemas dentro de un anillo de 70 cm para capturar datos a 17 GB/s, con una resolución declarada de hasta 0,5 mm y un objetivo de 358.000 elementos ultrasónicos. El sistema se encuentra actualmente en la Gen 1, con escaneos que toman 20 minutos y sin uso de IA en la generación de imágenes aún, aunque las futuras versiones buscan integrar IA y alcanzar 50.000 escáneres al permitir 1.000 millones de escaneos mensuales.

media r/LocalLLaMA · hace 14 d

El efecto del aumento de precios es salvaje

Una publicación en Reddit discute el posible lanzamiento de Q.01, señalando que la precisión ya no es una prioridad. La publicación destaca un fenómeno denominado 'efecto del aumento de precios' como significativo e inesperado.

arxiv arXiv cs.LG · hace 14 d

El RL guiado por discriminador corrige el emparejamiento de flujos con recompensas alineadas a los datos

El RL guiado por discriminador (DRL) utiliza un espacio de representaciones preentrenado para entrenar un discriminador que separa los datos reales de las muestras generadas por el modelo. Su logit se usa como recompensa en el RL con regularización KL, alineando las salidas del modelo con la realismo visual y semántico sin preferencias humanas. DRL mejora FID y FD semántico en modelos como SiT y JiT, y mejora la frontera de Pareto entre preferencia y fidelidad.

arxiv arXiv cs.LG · hace 14 d

Fusión Esencial de Subespacios para Aprendizaje Multitarea

La Fusión Esencial de Subespacios (ESM) reduce la interferencia entre tareas al centrarse en las direcciones principales de los cambios de activación. ESM++ extiende esto con selección dinámica de expertos mediante enrutamiento basado en prototipos, permitiendo una fusión eficiente de modelos multitarea sin entrenamiento.

arxiv arXiv cs.LG · hace 14 d

Preentrenamiento de Reflexión de Seguridad para LLMs

El Preentrenamiento de Reflexión de Seguridad inserta breves reflexiones de seguridad en los datos de preentrenamiento para habilitar la auto-monitoreo en modelos de lenguaje. Los experimentos con modelos de 1.7B en FineWeb-Edu muestran una mayor precisión de seguridad y tasas reducidas de éxito de ataque, con MedSafetyWorld demostrando que el método previene mejor que la filtración o reescritura de datos que los comportamientos inseguros se generalicen a partir de datos seguros.