Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 71

Modelo de Acción Geométrica para el Aprendizaje de Políticas Robóticas

El Modelo de Acción Geométrica (GAM) permite que las políticas robóticas razonen sobre interacciones físicas en 3D mediante la reutilización de un modelo base geométrico preentrenado. GAM divide el GFM para servir como codificador de observaciones y predictor causal del futuro, luego enruta la geometría futura y las acciones predichas a través del mismo backbone, logrando un rendimiento preciso, robusto y eficiente en manipulación en simulación y benchmarks con robots reales.

arxiv arXiv cs.LG · hace 2 h

Estimación exacta del puntaje posterior para problemas inversos lineales

El artículo deriva el puntaje posterior exacto en forma cerrada para problemas inversos gaussianos lineales, permitiendo un muestreo posterior eficiente mediante desruido. Introduce Exact Posterior Score (EPS), un objetivo de entrenamiento que preserva la estructura del preentrenamiento y logra un rendimiento superior en métricas de fidelidad, perceptual y distribucional con menos evaluaciones del desruidor que los métodos basados en gradientes.

media r/LocalLLaMA · hace 2 h

Usuario construye un rig de LLM local al máximo con RTX Pro 5000 y Ryzen 9950X3D

Un usuario de Reddit comparte la finalización de una estación de trabajo de IA local de alta gama que cuenta con una GPU NVIDIA RTX Pro 5000, CPU AMD Ryzen 9 9950X3D, 192GB de RAM y 80GB de VRAM. La construcción se completó después de que la solicitud del usuario para el programa NVIDIA Inception fuera rechazada y los precios de la RTX Pro 6000 superaran su presupuesto.

media r/LocalLLaMA · hace 2 h

Probé qué modelo envía el mejor correo electrónico en formato HTML

Un usuario implementó recientemente la herramienta Mailcue, que incluye un servidor MCP para la gestión de correos electrónicos, y probó tres modelos específicos para determinar cuál genera los correos electrónicos en formato HTML más atractivos visualmente. Los modelos evaluados fueron google/gemma-4-26b-a4b-qat, qwen/qwen3.6-35b-a3b y qwen/qwen3.6-27b.

Modelo de Acción Geométrica para el Aprendizaje de Políticas Robóticas

Estimación exacta del puntaje posterior para problemas inversos lineales

Usuario construye un rig de LLM local al máximo con RTX Pro 5000 y Ryzen 9950X3D

Probé qué modelo envía el mejor correo electrónico en formato HTML

Publicación de Reddit: 10x Kaioken SSJ1 de 4º grado, ¿vale la pena en 2026? ¿Puede ejecutar Qwen3.6?

Actualización del Benchmark US Ban: GPT-5.6 empata con Anthropic

Koboldcpp v1.116 lanzado

Evaluación ciega de 55 LLM: El sesgo de calificación intra-familia es estadísticamente significativo

El usuario pregunta si vale la pena comprar 2x RX 9060xt 16GB para ejecutar Qwen 3.6 27B

Redacción completa de documentos con Qwen 3.6 27B y un agente Pi

claude_converter: Convierte sesiones de Claude Code en datos de ajuste fino

¿Serán los modelos de código abierto chinos la única opción pronto?

Registro de Modelos: Torrents para modelos abiertos usando Hugging Face como semilla web de respaldo.

Home Lab: 4x 4090 modificadas para inferencia de LLM local

¿Podrían los escaladores de juegos con IA beneficiarse de adaptadores ligeros específicos para cada juego?

Modelo más grande con menos de 64 GB de VRAM para destilación

Impacto de la cuantización en las tasas de aceptación de borradores MTP

Ejecutar GLM5.2 en hardware económico < $2500

Usuarios reportan que Ornith 35B supera a Qwen en generación de juegos 3D

Observaciones sobre el declive de las discusiones sobre ajuste fino para hardware de consumo