Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 133

Comprender para participar

Geoffrey Litt argumenta que los desarrolladores deben comprender profundamente el código generado por agentes de codificación para evitar la deuda cognitiva y permanecer como participantes activos en el proceso creativo.

media r/LocalLLaMA · hace 3 h

OpenLumara ahora conecta cualquier UI a modelos locales mediante endpoint de OpenAI

El framework de código abierto OpenLumara ahora admite la conexión a cualquier interfaz de usuario que pueda comunicarse con un endpoint de OpenAI, como KoboldLite y OpenWebUI. Esta actualización permite a los usuarios integrar el marco eficiente en tokens en sus flujos de trabajo existentes sin cambiar su frontend preferido.

media r/LocalLLaMA · hace 3 h

¿Alguien usa LLM locales para la generación a gran escala de datos espaciales o diseño urbano en software como QGIS?

Un usuario busca recomendaciones de modelos de lenguaje locales capaces de generar datos estructurales a gran escala, como diseños completos de ciudades, redes viales y sistemas de cuadrícula complejos.

media r/LocalLLaMA · hace 5 h

R9700 dual: ¿Mejor fórmula para Qwen3.6 27B?

Un usuario investiga la optimización del modelo Qwen3.6-27B en una configuración con dos tarjetas AMD Radeon R9700 usando llama.cpp, comparando el rendimiento entre los backends de Vulkan y ROCm.

media r/LocalLLaMA · hace 5 h

Los kernels WebGPU para Gemma 4 alcanzan 255 tok/s

Xenova ha lanzado kernels WebGPU para Gemma 4, logrando un rendimiento de 255 tokens por segundo. Esta optimización permite que los modelos densos funcionen a velocidades superiores a 100 tok/s en navegadores web.

blog Simon Willison · hace 5 h

Uso de DSPy para evaluar y mejorar los prompts del sistema SQL del Agente Datasette

Simon Willison utilizó Claude Code con el modelo Fable 5 para automatizar la evaluación y optimización de los prompts del sistema para el Agente Datasette, enfocándose específicamente en su función de ejecución de consultas SQL solo de lectura. El proceso implicó instalar la última versión alpha de Datasette y DSPy para identificar debilidades en cómo el agente maneja la información del esquema.

media r/LocalLLaMA · hace 6 h

El pionero de IA de Nvidia rechaza la AGI y compara a OpenAI y Anthropic con AOL

Una figura destacada de Nvidia ha declarado que no cree en la Inteligencia General Artificial (AGI) y argumenta que el enfoque de la industria debe cambiar hacia modelos personalizados de código abierto para empresas.

media r/LocalLLaMA · hace 6 h

Benchmarks locales con una RTX 3090 - Qwen3.6 27b vs Ornith

Un usuario comparó Qwen3.6 27b, Gemma4 26B A4B QAT y Ornith1.0 35B MoE utilizando el framework inspect-ai en una RTX 3090 para evaluar el rendimiento de modelos locales. Las pruebas revelaron resultados mixtos en benchmarks de conocimiento general, fundamentación y codificación, con Qwen3.6 liderando generalmente en puntuaciones mientras que Ornith mostró fortalezas en áreas específicas como DROP.

media Hugging Face Forums · hace 7 h

Prueba de estrés epistémica — Claude Sonnet 5 validado por MarCognity-AI

El artículo describe una validación de Claude Sonnet 5 utilizando el Agente Escéptico de MarCognity-AI para exponer la brecha entre la confianza textual y la verificabilidad real, denominada «fractura epistémica».

media Hugging Face Forums · hace 7 h

El framework Aiywin propone recursión espiral para el razonamiento de IA

El desarrollador independiente Aiywin.ai presenta un marco cognitivo que reemplaza el procesamiento lineal estándar con bucles de recursión espiral para manejar anomalías y datos incompletos. El sistema expande matemáticamente los parámetros contextuales hasta encontrar una resolución estructurada, en lugar de detenerse o alucinar.

media Hugging Face Forums · hace 8 h

Benchmarking de Solo y MoA en múltiples tareas

El artículo presenta resultados de benchmark que comparan modelos individuales frente a configuraciones de Mixture-of-Agents (MoA) en seis tareas: Bug, Tool, Arch, Clinical, DLQ y un promedio general. El framework de evaluación utilizó Hermes Agent v0.18, con puntuaciones generadas por ChatGPT 5.5 y Claude opus 4.8 basándose en una rúbrica que pondera Correctness, Completeness, Depth, Actionability, Clarity y Trust.

media r/LocalLLaMA · hace 8 h

El usuario solicita modelos de visión para detectar fuego o humo

Un usuario de Reddit busca recomendaciones de modelos de visión capaces de detectar fuego o humo, específicamente en el contexto de monitorear escombros que arden lentamente durante la temporada de fuegos artificiales del 4 de julio.

media r/LocalLLaMA · hace 9 h

El análisis de 2.3k aplicaciones de IA local revela 82 categorías y diversos casos de uso

Un análisis de la Mac App Store identificó 2,259 aplicaciones de IA local entre más de 20,000 entradas extraídas, destacando un ecosistema creciente de herramientas de nicho que empaquetan modelos con flujos de trabajo específicos. La encuesta cubre 82 categorías distintas, desde tareas comunes como transcripción y OCR hasta funciones especializadas como estilismo de armario y asistencia para la salud de mascotas.

media r/LocalLLaMA · hace 10 h

Gemma-4-31B afinado para Copywriting: +290 Elo en EqBench3

Un usuario ha lanzado un fine-tune estrecho del modelo Gemma-4-31B-it específicamente optimizado para tareas de copywriting y escritura creativa. El modelo fue entrenado para eliminar clichés genéricos de marketing y adoptar un estilo de respuesta directa caracterizado por especificaciones concretas y llamadas a la acción precisas.

media r/LocalLLaMA · hace 10 h

Ejecutando MiniMax M2.7 Q3 XL en 6 GPUs NVIDIA P40

Un usuario detalla el despliegue exitoso del modelo MiniMax M2.7 Q3_K_XL en seis GPUs NVIDIA Tesla P40, proporcionando una configuración de hardware completa y configuraciones de inferencia optimizadas para alojamiento local de LLM.

github llama.cpp · hace 12 h

La versión b9860 de llama.cpp añade la API llama_ftype_name

El proyecto llama.cpp ha lanzado la versión b9860, introduciendo una nueva función pública de C API llamada `llama_ftype_name` para exponer el nombre del tipo de archivo del modelo (cuantización).

media r/LocalLLaMA · hace 12 h

Los agentes están escribiendo colaborativamente una wiki masiva sobre RL para LLMs (más de 200 artículos hasta ahora) y cualquiera puede unirse

Se está llevando a cabo un proyecto colaborativo donde los agentes de IA están compilando una wiki exhaustiva sobre aprendizaje por refuerzo para modelos de lenguaje grandes, habiendo procesado ya más de 200 artículos de investigación.

media r/LocalLLaMA · hace 12 h

Publicación en Reddit insta a apreciar a los desarrolladores de código abierto

Un usuario de Reddit destaca la necesidad crítica de gratitud hacia los colaboradores de código abierto, citando las recientes actualizaciones rápidas de vLLM como un ejemplo destacado del esfuerzo comunitario.

media r/LocalLLaMA · hace 12 h

Reconstruyendo Gemma 4 31b... mejor... Como 26b...

Un desarrollador describe un plan para reconstruir el modelo Gemma 4 31B reduciendo su conteo de parámetros a aproximadamente 26B mientras busca mejorar el rendimiento. El proyecto implica cambios arquitectónicos, técnicas de entrenamiento específicas y curación de conjuntos de datos para crear un modelo más pequeño y eficiente.

media r/LocalLLaMA · hace 12 h

poolside/Laguna-XS-2.1

El artículo anuncia el lanzamiento de Laguna-XS-2.1, un modelo disponible en Hugging Face bajo la organización poolside.