Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 94

Evaluación ciega de 55 LLM: El sesgo de calificación intra-familia es estadísticamente significativo

Una evaluación abierta que involucró a 55 modelos de 11 familias de desarrolladores reveló que los grandes modelos de lenguaje exhiben un sesgo de grupo estadísticamente significativo al calificarse mutuamente en ciego. A lo largo de 22,254 juicios válidos, cada familia con datos suficientes mostró una tendencia a calificar a sus propios miembros de manera diferente a la de otras familias.

media r/LocalLLaMA · hace 12 h

El usuario pregunta si vale la pena comprar 2x RX 9060xt 16GB para ejecutar Qwen 3.6 27B

Un usuario de Reddit pregunta si comprar dos tarjetas gráficas AMD Radeon RX 9060 XT con 16GB de VRAM cada una es una inversión rentable para ejecutar el modelo Qwen 3.6 27B y arquitecturas similares.

media r/LocalLLaMA · hace 12 h

Redacción completa de documentos con Qwen 3.6 27B y un agente Pi

El autor demuestra que los modelos locales, específicamente Qwen 3.6 27B, pueden realizar una redacción de documentos de extremo a extremo cuando se optimizan con un nivel de cuantización más alto y un arnés de agente que utiliza el marco PI.

media r/LocalLLaMA · hace 12 h

claude_converter: Convierte sesiones de Claude Code en datos de ajuste fino

El autor desarrolló `claude_converter`, una herramienta que convierte archivos de sesión `.jsonl` locales de Claude Code en formatos compatibles con marcos de ajuste fino como TRL, Axolotl y LLaMA-Factory.

media r/LocalLLaMA · hace 12 h

¿Serán los modelos de código abierto chinos la única opción pronto?

Un usuario de Reddit argumenta que las empresas tecnológicas de EE. UU. buscan el control global total sobre la IA y ven el lanzamiento de modelos avanzados como una amenaza para ese dominio.

media r/LocalLLaMA · hace 12 h

Registro de Modelos: Torrents para modelos abiertos usando Hugging Face como semilla web de respaldo.

Se ha creado un nuevo repositorio y sitio llamado Registro de Modelos para publicar y compartir archivos .torrent de modelos abiertos populares, utilizando Hugging Face como semilla web de respaldo. El proyecto incluye scripts para automatizar el proceso y un servicio backend que redirige los clientes BitTorrent al punto final correcto de Hugging Face.

media r/LocalLLaMA · hace 13 h

Home Lab: 4x 4090 modificadas para inferencia de LLM local

Un usuario detalla una configuración de inferencia local de alto rendimiento que utiliza cuatro GPUs NVIDIA RTX 4090 modificadas con 192GB de VRAM, combinadas con una placa base WRX90E-SAGE SE y una fuente de alimentación de 3000W.

media r/LocalLLaMA · hace 13 h

¿Podrían los escaladores de juegos con IA beneficiarse de adaptadores ligeros específicos para cada juego?

Un usuario de Reddit propone que las tecnologías de superresolución por IA como DLSS y FSR podrían utilizar capas de adaptador ligeras y específicas para cada juego para mejorar el rendimiento en hardware de bajo consumo.

media r/LocalLLaMA · hace 13 h

Modelo más grande con menos de 64 GB de VRAM para destilación

Un usuario de Reddit busca recomendaciones del modelo de razonamiento capaz más grande que se ajuste a un límite de 64 GB de VRAM con el propósito de destilación de conocimiento.

media r/LocalLLaMA · hace 13 h

Impacto de la cuantización en las tasas de aceptación de borradores MTP

Un análisis del descodificación especulativa utilizando modelos Gemma 4-31B-it demuestra que una cuantización intensa reduce la tasa de aceptación de tokens porque el modelo principal se vuelve menos consistente con el creador de borradores. Las pruebas en cuantizaciones Q5_K_S, IQ4_XS, IQ3_M e IQ2_M revelan cómo la profundidad del borrador afecta el rendimiento.

media r/LocalLLaMA · hace 13 h

Ejecutar GLM5.2 en hardware económico < $2500

Un usuario de Reddit demuestra cómo ensamblar un equipo local de inferencia de IA por menos de $2500 utilizando componentes asequibles de segunda mano, apuntando específicamente a la capacidad de ejecutar modelos de lenguaje grandes como GLM-5.2 sin hardware empresarial costoso.

media r/LocalLLaMA · hace 13 h

Usuarios reportan que Ornith 35B supera a Qwen en generación de juegos 3D

Un usuario de Reddit comparte su experiencia usando el entorno de Claude Code para generar un juego 3D con el modelo Ornith 35B. Después de tres prompts, el modelo produjo con éxito la salida solicitada, mientras que el modelo Qwen3.5-35b-a3b no lo logró incluso después de múltiples intentos.

media r/LocalLLaMA · hace 13 h

Observaciones sobre el declive de las discusiones sobre ajuste fino para hardware de consumo

Un usuario de Reddit señala que el interés en ajustar modelos en hardware de grado consumidor parece haber disminuido desde el lanzamiento de modelos generalistas capaces como Llama-3-8b. El autor sugiere que la mejora en la inteligencia del modelo base reduce la necesidad de ajuste fino, ya que la ingeniería de prompts suele ser suficiente.

media r/LocalLLaMA · hace 13 h

Google organiza hackathons para modelos pequeños como Gemma 4 31B

Google está organizando hackathons centrados en modelos de lenguaje pequeños, específicamente el Gemma 4 31B, para demostrar su valor en la ingeniería de software asistida por IA. Esta iniciativa destaca la creencia continua de la compañía en la utilidad de los modelos más pequeños a pesar de la tendencia de la industria hacia modelos más grandes.

media r/LocalLLaMA · hace 13 h

Mythos fue el primero, ahora GPT-5.6

El texto proporcionado es una publicación de Reddit que discute el modelo GPT-5.6 de OpenAI y sus limitaciones en el lanzamiento tras una solicitud gubernamental.

media r/LocalLLaMA · hace 13 h

Vaya ... Le compré una Diet Pepsi a mi esposa.

Un usuario de Reddit en la comunidad r/LocalLLaMA compartió una imagen con el pie de foto "Esposa feliz, vida feliz" como dicen. La publicación es una anécdota personal sobre la compra de una Diet Pepsi para la esposa del usuario.

media r/LocalLLaMA · hace 14 h

ObviousBench: Un benchmark para fallos evidentes de LLM en modelos más pequeños

ObviousBench es un nuevo benchmark diseñado para evaluar fallos visibles en modelos de lenguaje grandes, centrándose en cómo las elecciones de configuración impactan las tasas de error. La herramienta destaca los compromisos entre el tamaño del modelo, la velocidad y las capacidades de razonamiento en lugar de simplemente clasificar el rendimiento.

media r/LocalLLaMA · hace 14 h

Entrevista a Cory Doctorow sobre IA y defensa de la IA local

Esta publicación de Reddit comparte una entrevista de Ars Technica con Cory Doctorow sobre sus opiniones respecto a la inteligencia artificial. El autor original destaca el tono crítico del artículo hacia las grandes empresas tecnológicas que intentan salir a bolsa.

media r/LocalLLaMA · hace 14 h

SupraLabs lanza SupraSafety-18M, un modelo diminuto de moderación de contenido

SupraLabs ha lanzado SupraSafety-18M, un clasificador binario de texto estilo BERT con 18 millones de parámetros diseñado para la moderación de contenido en dispositivos periféricos y teléfonos móviles. El modelo fue entrenado desde cero en el nvidia/Nemotron-3.5-Content-Safety-Dataset y alcanza una precisión del 81,2 % y un recall del 86,9 %.

media r/LocalLLaMA · hace 14 h

Operador de laboratorio de GPU advierte contra pedidos anticipados de 4090 y 5090 de 96GB

Un operador de laboratorio de GPU en EE. UU. que colabora con fábricas chinas para producir PCBs modificados de RTX 4090 de 48GB advierte que los listados de RTX 4090 y RTX 5090 de 96GB son estafas a partir de junio de 2026.