Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 133

Reconstruyendo Gemma 4 31b... mejor... Como 26b...

Un desarrollador describe un plan para reconstruir el modelo Gemma 4 31B reduciendo su conteo de parámetros a aproximadamente 26B mientras busca mejorar el rendimiento. El proyecto implica cambios arquitectónicos, técnicas de entrenamiento específicas y curación de conjuntos de datos para crear un modelo más pequeño y eficiente.

media r/LocalLLaMA · hace 10 h

poolside/Laguna-XS-2.1

El artículo anuncia el lanzamiento de Laguna-XS-2.1, un modelo disponible en Hugging Face bajo la organización poolside.

media r/LocalLLaMA · hace 10 h

Kimi K2.7 Code ya está disponible en GitHub Copilot

El modelo Kimi K2.7 Code de Moonshot AI se ha hecho generalmente disponible dentro de la plataforma GitHub Copilot.

media r/LocalLLaMA · hace 12 h

Un usuario de Reddit pregunta si Ubuntu es la distribución de Linux más compatible para IA local

Un usuario de Reddit en la comunidad r/LocalLLaMA está cambiando a Linux y busca confirmación sobre si Ubuntu ofrece la mejor compatibilidad para ejecutar cargas de trabajo de IA local.

media Hugging Face Forums · hace 12 h

Soporte de caracteres Unicode en descargas del sitio web

El sitio web de Hugging Face no codifica correctamente los caracteres Unicode al descargar archivos individuales de un conjunto de datos, ya sea a través del botón de descarga o la URL resolve.

media Hugging Face Forums · hace 12 h

¿Pueden los agentes LLM desarrollar precognición?

El artículo argumenta que los agentes LLM actuales a menudo actúan con una conciencia implícita de las consecuencias, lo cual es insuficiente para tareas consecuentes. Propone la "precognición explícita" como una capa arquitectónica requerida para asegurar que los agentes modelen riesgos y pronostiquen efectos antes de la ejecución.

media Hugging Face Forums · hace 12 h

¿Qué modelo de código abierto funciona mejor para agentes de atención al cliente?

Un usuario del foro de Hugging Face pregunta cuál es el mejor modelo de IA gratuito para construir un chatbot o asistente virtual de atención al cliente. La publicación no contiene comparaciones específicas de modelos, resultados de pruebas ni detalles técnicos.

media Hugging Face Forums · hace 12 h

Error en el contador de descargas para modelos en Hugging Face

Un usuario en el foro de la comunidad de Hugging Face informó que las estadísticas de descarga para su repositorio de modelos, InternScience/Agents-A1-FP8, se han mantenido en cero a pesar de haberse subido dos días antes. El usuario señala que el repositorio incluye un archivo config.json y sospecha que un problema técnico está impidiendo que el contador se actualice.

media Hugging Face Forums · hace 12 h

Usuarios informan de retraso en la respuesta del soporte de facturación de Hugging Face

Un usuario en el foro de discusión de Hugging Face informa que su correo electrónico al soporte de facturación sobre una suscripción no autorizada no ha recibido respuesta. La persona busca un reembolso por el cargo accidental y señala la falta de comunicación a pesar de haber contactado ya al equipo de soporte.

media Hugging Face Forums · hace 12 h

Mejores prácticas para detectar y obtener deltas de conjuntos de datos

Un usuario en el foro de Hugging Face solicita métodos eficientes para detectar cuándo se agregan nuevos datos o se actualiza un conjunto de datos, con el objetivo de activar pipelines sin reprocesar todo el conjunto de datos.

media r/LocalLLaMA · hace 12 h

Bonsai-8B de 1 bit de PrismML supera a IBM Granite en llamada de herramientas en CPU con gramática

Una evaluación del modelo Bonsai-8B de 1 bit de PrismML contra IBM Granite y otros LLMs revela que Bonsai-8B logra la mayor precisión en llamadas de herramientas al usar decodificación restringida por gramática. La prueba, realizada en CPU con llama.cpp, destaca el papel crítico de las restricciones de salida para permitir que modelos pequeños y cuantizados funcionen eficazmente en tareas de agentes.

media r/LocalLLaMA · hace 12 h

Lemonade SDK lanza RPG-HaloTales-V1 para role-playing multimedia local

El SDK de Lemonade ha lanzado un nuevo modelo llamado RPG-HaloTales-V1, diseñado para proporcionar una experiencia de role-playing multimedia que los usuarios pueden ejecutar localmente.

media r/LocalLLaMA · hace 12 h

Backend de LLM local de código abierto para conversaciones entre NPCs

El autor ha lanzado un backend de voz a voz completamente local y de código abierto diseñado para NPCs de Modelos de Lenguaje Grande que permite interacciones directas entre NPC sin dependencia de la nube. El sistema integra componentes de voz a texto, un LLM local y texto a voz para permitir que los NPCs conversen entre sí, retengan el contexto e influyan en las interacciones futuras con el jugador.

media r/LocalLLaMA · hace 13 h

¿Mejor modelo de codificación para configuración con 3x Spark?

Un usuario busca recomendaciones sobre el mejor modelo de codificación para ejecutar en una configuración de hardware dedicada que consta de tres unidades Asus Ascent GX10 (GB10), esperando una concurrencia de 5 a 10 usuarios.

media r/LocalLLaMA · hace 13 h

Andi de Hugging Face demuestra una canalización de voz completamente de código abierto utilizando Gemma 4 31B

Andi de Hugging Face ha lanzado una demo totalmente de código abierto y gratuita que crea una canalización de interacción por voz. El sistema integra Nvidia parakeet, el modelo Gemma 4 31B servido por Cerebras, e inferencia personalizada para Qwen3TTS.

media r/LocalLLaMA · hace 13 h

Z.ai lanza ZCode para desafiar a Cursor, Claude Code y GitHub Copilot en la codificación con IA

Z.ai ha presentado ZCode, una nueva herramienta de codificación con IA diseñada para competir con plataformas establecidas como Cursor, Claude Code y GitHub Copilot.

media r/LocalLLaMA · hace 13 h

Actualización SimpleLLMChat 1.2.5 para IA Agéntica en Windows XP

El desarrollador ha lanzado la versión 1.2.5 de SimpleLLMChat, un arnés de IA agéntica diseñado para ejecutarse en máquinas heredadas con Windows XP y .NET 4.0.

media r/LocalLLaMA · hace 13 h

¿Qué hay en tu RAG?

Un usuario de Reddit cuestiona la utilidad práctica de la Generación Aumentada por Recuperación (RAG) para proyectos personales que implican programación, trabajo de sysadmin y pequeñas bases de código. El autor argumenta que el conocimiento estándar de la industria ya está bien cubierto por los modelos, mientras que las fuentes de datos específicas como bases de código o referencias de API son demasiado pequeñas para requerir indexación o demasiado grandes para gestionarse eficientemente.

media r/LocalLLaMA · hace 13 h

El CEO de Palantir se enfurece contra los modelos cerrados

El CEO de Palantir, Alex Karp, ha criticado públicamente a Anthropic y OpenAI por supuestamente cobrar en exceso a los clientes y malutilizar sus datos. Esta postura llega mientras Palantir recientemente aseguró un acuerdo para comprar chips Nvidia para ejecutar modelos locales para sus clientes empresariales.

media r/LocalLLaMA · hace 13 h

Un truco económico para una salida estructurada fiable: retroalimentar el error de validación en el reintento

Para mejorar la fiabilidad al generar salidas estructuradas a partir de modelos de lenguaje grandes, se propone un método que alimenta los errores de validación y la salida anterior del modelo de vuelta al prompt durante los reintentos. Este enfoque transforma el proceso de volver a tirar respuestas aleatorias a autocorregir errores específicos editando el intento previo.