Todos los artículos — korshunov.ai

Todos los artículos Página 122 / 128

Evalatro: un benchmark abierto donde los LLM juegan al Balatro real

Evalatro es un benchmark abierto que permite a los LLM jugar al juego real Balatro. Los modelos reciben el estado del juego como texto, toman decisiones de forma independiente y compiten para alcanzar la Ante 12, con resultados actuales que muestran un progreso limitado: mimo-v2.5-pro alcanzó la Ante 5, y deepseek-v4-pro no logró superar la Ante 8.

media r/LocalLLaMA · hace 14 d

Hardware más económico para Qwen 3.6: modelos de 27B y 35B-A3B

Una publicación en Reddit analiza la configuración de hardware rentable para ejecutar los modelos Qwen 3.6, tanto el de 27B como el de 35B-A3B, señalando que la RTX 3090 de 24GB ofrece mejor valor a largo plazo frente a la Tesla V100 debido a su descontinuación y las alternativas chinas próximas. La configuración propuesta suma $1,995.65, incluyendo un Ryzen 5 5600X, una RTX 3090 de 24GB y componentes esenciales, siendo el precio total una preocupación clave para los usuarios que buscan asequibilidad.

media r/LocalLLaMA · hace 14 d

Deja de usar Ollama

Una publicación de blog y una publicación en Reddit instan a los usuarios a dejar de usar Ollama, citando preocupaciones sobre seguridad, privacidad y los riesgos de ejecutar modelos de lenguaje grandes localmente. El autor argumenta que las soluciones alternativas ofrecen un mejor control y seguridad para los usuarios.

media r/LocalLLaMA · hace 14 d

El fundador de Hashicorp afirma que los modelos locales aún no son lo suficientemente buenos

Mitchell Hashimoto, fundador de Hashicorp, afirma que los modelos de lenguaje locales aún no son lo suficientemente buenos. Un usuario de Reddit discrepa de esta afirmación, señalando que durante más de un año, muchas personas han utilizado con éxito modelos locales para programación, y solo los 'vibecoders' han enfrentado desafíos.

github LangGraph · hace 14 d

langgraph-cli 0.4.30 lanzado

La versión 0.4.30 de langgraph-cli ya está disponible, con soporte para rangos de versiones de API compatibles. El lanzamiento también incluye estructuras de README.md estandarizadas para una mejor consistencia en la documentación.

lab Claude Code Releases · hace 14 d

Notas de la versión de Claude v2.1.178

Claude v2.1.178 introduce nuevas reglas de permisos utilizando la sintaxis Tool(param:value), mejora la carga de flujos de trabajo y habilidades en directorios anidados, y optimiza el modo automático y los mensajes de error. Corrige problemas críticos como bloqueos, errores de autenticación y comportamiento de la interfaz de usuario en Chrome y VSCode, mientras refina las indicaciones de las herramientas y la funcionalidad de deshacer.

github llama.cpp · hace 14 d

llama.cpp lanza la versión b9672 con actualización de BoringSSL

llama.cpp ha lanzado la versión b9672, actualizando BoringSSL a 0.20260616.0. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, ROCm, OpenVINO y SYCL.

media r/LocalLLaMA · hace 14 d

Benchmark para LLMs pequeños en búsqueda de archivos con lenguaje natural

Un benchmark evalúa LLMs pequeños (0.3B–3B parámetros) en la conversión de consultas en lenguaje natural a JSON estructurado, centrándose en el tipo de archivo, contexto temporal, especificidad y consultas combinadas. Los resultados muestran que los modelos con 0.8B–1.5B parámetros superan a los de menos de 0.5B, con el proyecto teniendo como objetivo ampliar el conjunto de pruebas y explorar el ajuste fino para mejorar el rendimiento.

media r/LocalLLaMA · hace 14 d

Hilo de construcción comunitaria de modelos: el entrenamiento colaborativo es viable

Un modelo comunitario puede construirse mediante computación crowdsourced utilizando un enfoque 'Branch-Train-Stitch'. Los participantes entrenan un modelo prototipo en su hardware, envían submodelos de dominio estrecho y los organizadores los ensamblan en un gran modelo Mixture-of-Experts (MoE), con decisiones clave que incluyen el tamaño del prototipo, las definiciones de alcance y los protocolos de entrenamiento.

media r/LocalLLaMA · hace 14 d

GLM-5.2 supera el 80% en Terminal-Bench

GLM-5.2 es el primer modelo de pesos abiertos que alcanza una precisión del 80% en Terminal-Bench y supera a todos los demás modelos disponibles de código abierto. También supera a Gemini, posicionándolo como un modelo de vanguardia a un costo significativamente menor.

github Goose (Block) · hace 14 d

Rama de lanzamiento creada para v1.38.0

Se ha creado una rama de lanzamiento para la versión 1.38.0. Esto marca el inicio del proceso de lanzamiento de la actualización.

media r/LocalLLaMA · hace 14 d

GLM-5.2 ocupa el segundo lugar en la Arena de WebDew

GLM-5.2 ha asegurado la segunda posición en la evaluación de benchmarking de la Arena de WebDew. El resultado refleja su sólido desempeño en tareas de comprensión y generación del lenguaje natural en comparación con otros modelos.

media r/LocalLLaMA · hace 14 d

GLM-5.2 ya disponible en HuggingChat

El modelo GLM-5.2 ya es accesible en HuggingChat. Los usuarios pueden acceder a él a través del enlace de HuggingFace proporcionado, lo que permite la interacción directa con el modelo a través de la plataforma.

media r/LocalLLaMA · hace 14 d

Glimmer 1: un modelo de lenguaje fundamental de 10.000 parámetros

Glimmer 1 es un modelo de lenguaje de 10.000 parámetros entrenado con 500K tokens de FineWeb-Edu. Cuenta con una ventana de contexto de 512 tokens, una arquitectura Llama estándar con 16 dimensiones ocultas, 2 capas, 4 cabezales de atención y 1 cabezal KV utilizando GQA, y está disponible en Hugging Face.

media r/LocalLLaMA · hace 14 d

Mistral anuncia una nueva familia de modelos de peso abierto en julio

Mistral ha lanzado una nueva familia de modelos de lenguaje de peso abierto en julio. Los modelos están diseñados para ser accesibles y utilizables por desarrolladores e investigadores de todo el mundo, promoviendo la transparencia y la innovación en IA.

media r/LocalLLaMA · hace 14 d

zai-org lanza GLM-5.2

zai-org ha lanzado GLM-5.2, un nuevo modelo de lenguaje grande. El modelo está disponible en Hugging Face y forma parte de las discusiones de la comunidad LocalLLaMA.

media r/LocalLLaMA · hace 14 d

bartowski/command-a-plus-05-2026-GGUF en Hugging Face

Un modelo GGUF llamado command-a-plus-05-2026 está disponible en Hugging Face. Se anima a los usuarios a probarlo con la última versión de llama.cpp y compartir las métricas de rendimiento y comentarios.

media r/LocalLLaMA · hace 14 d

¿Alguien está ejecutando Qwen 3.6 27b UD Q8 en múltiples GPUs?

Un usuario pregunta si alguien ha logrado ejecutar Qwen 3.6 27b UD Q8 en múltiples GPUs, señalando problemas con llamacpp y vllm. El modelo se bloquea o se congela durante las solicitudes de múltiples turnos, con llamacpp mostrando errores de CUDA y vllm fallando a mitad del turno, a pesar de funcionar bien con la cuantización Q5.

blog Simon Willison · hace 14 d

Georgi Gerganov elogia a Qwen3.6-27B para tareas de programación

Georgi Gerganov confirma que Qwen3.6-27B es altamente capaz para tareas de programación, señalando su uso diario en hardware local como M2 Ultra y RTX 5090. Describe el uso de un agente pi mínimo con un prompt de sistema breve para alinearlo con su flujo de trabajo, destacando su utilidad para mantener proyectos de código abierto.

media r/LocalLLaMA · hace 14 d

Mejor modelo y configuración para MacBook Pro M5 Max de 128 GB de RAM y 8 TB

El mejor modelo para ejecutar en un MacBook Pro M5 Max con 128 GB de RAM y 8 TB es LocalLLaMA, optimizado para inferencia local con mínima sobrecarga de memoria. Las configuraciones deben priorizar modelos más pequeños como LLaMA-3-8B o LLaMA-3-7B con cuantización para garantizar un rendimiento eficiente dentro de la memoria disponible.