Todos los artículos
media r/LocalLLaMA · hace 4 h

Usuario pregunta sobre la destilación de modelos para demostración de teoremas con agentes

Un usuario en r/LocalLLaMA está considerando autoalojar modelos para demostración de teoremas con agentes con el fin de reducir costos, ya que tiene financiación de hardware pero no créditos de LLM. Propone destilar capacidades de un modelo más grande en uno más pequeño adecuado para casos de uso específicos como Rocq, señalando la falta de modelos existentes para este lenguaje específico.

media r/LocalLLaMA · hace 4 h

Un usuario compra un Minisforum MS-S1 Max usado para cargas de trabajo de LLM locales

Un usuario comparte su decisión de comprar un Minisforum MS-S1 Max ligeramente usado con 128GB de memoria por aproximadamente US$2800, citando el aumento de costos del hardware de Apple y los servicios de modelos cerrados como principales motivadores. El autor compara esta compra favorablemente frente al nuevo Geekom A9 Mega, destacando las ventajas específicas del MS-S1, incluyendo red 10Gbe, USB4v2 de 80Gbps, una ranura PCIe y una fuente de alimentación interna.

media r/LocalLLaMA · hace 4 h

Nemotron-3-Super-120B-A12B logra recuperación perfecta de agujas hasta 504K tokens en 4×3090

Un usuario probó el modelo Nemotron-3-Super-120B-A12B de NVIDIA, que combina arquitecturas híbridas Mamba y MoE, logrando recuperación exacta en pruebas de aguja en un pajar hasta 504.482 tokens. El modelo se ejecutó completamente en GPU a través de cuatro RTX 3090 usando la cuantización i1-Q4_K_S, demostrando que sus capas Mamba mantienen un estado recurrente de tamaño constante en lugar de una KV cache en crecimiento.

media r/LocalLLaMA · hace 4 h

Desarrollador construye un entorno de trabajo LLM local-first y busca retroalimentación de la comunidad

Un desarrollador con 45 años de experiencia en software está completando un entorno de trabajo local-first para ejecutar modelos locales y de API, con lógica alrededor de múltiples agentes. El autor ha pasado seis meses construyendo herramientas para mejorar el flujo de trabajo de LLM local y ahora le pide a la comunidad qué características mejorarían su experiencia.

media r/LocalLLaMA · hace 5 h

Reseña del libro: Modelos de Lenguaje Pequeños Específicos del Dominio por Guglielmo Iozzia

Esta reseña evalúa el libro de Guglielmo Iozzia "Modelos de Lenguaje Pequeños Específicos del Dominio", que aboga por un cambio de paradigma desde los modelos de lenguaje grandes generalistas hacia modelos de lenguaje pequeños (SLM) especializados y ajustados finamente. El revisor argumenta que los SLM ofrecen un control, visibilidad y eficiencia de costos superiores para tareas específicas en comparación con el hype alrededor de la inteligencia artificial general.