Todos los artículos
media Hugging Face Forums · hace 3 h

Qwen3/Gemma3 Candle omite las máscaras de atención para lotes de longitud igual en modo CPU

Un usuario ha reportado un error crítico en la biblioteca text-embeddings-inference de Hugging Face que afecta a los modelos Qwen3 y Gemma3. El problema surge al ejecutar inferencia en CPUs con solicitudes concurrentes, lo que provoca una degradación significativa de la precisión. Específicamente, el backend Candle omite incorrectamente las máscaras de atención para lotes donde todas las secuencias de entrada tienen longitudes iguales. Este defecto compromete la fiabilidad de los embeddings generados bajo estas condiciones específicas. Para abordar el problema, el autor presentó una solicitud de extracción (pull request) que contiene una corrección probada exhaustivamente en sus máquinas locales. El error resalta posibles riesgos de estabilidad en servicios de embedding basados en CPU que manejan entradas por lotes.

media Hugging Face Forums · hace 3 h

Clasificador de audio Wav2vec2 y WavLM se queda atascado en 33% de precisión

Un usuario informa que el ajuste fino de wav2vec2-base o wavlm-base-plus para la clasificación de audio de 3 clases logra solo un 33% de precisión, igualando los niveles de azar. El modelo se entrena actualizando únicamente la cabeza de clasificación, utilizando clips rellenos de 1.0s de duración sin máscaras de atención, y con una tasa de aprendizaje de 1e-3, lo que lleva a un rendimiento deficiente a pesar del desequilibrio de clases y los clips de entrada cortos.

media Hugging Face Forums · hace 3 h

Las incrustaciones binarias nativas superan a la binarización posterior al entrenamiento

Un experimento a pequeña escala muestra que los modelos de incrustación binaria nativa logran un mejor rendimiento en recuperación que la binarización posterior al entrenamiento de modelos de punto flotante. En Recall@10 de SciFact, los modelos binarios nativos (de 2048 y 4096 dimensiones) superan a los modelos binarios posteriores al entrenamiento en un 17 % y un 25 %, respectivamente, con ventajas significativas en velocidad y memoria durante la indexación.

media Hugging Face Forums · hace 3 h

Buscando aval de cs.LG en arXiv para el Optimizador PsiLogic

Ali, un investigador independiente de 16 años, ha desarrollado PsiLogic, un optimizador de cancelación activa consciente del caos basado en Adam. Evaluado frente a AdamW y Lion utilizando FairBench en una NVIDIA H100, PsiLogic logró las mejores métricas de validación en tres de cuatro tareas y empató estadísticamente en la cuarta, aunque implica una sobrecarga por paso. El autor busca un aval para la presentación en arXiv bajo cs.LG, proporcionando un repositorio de GitHub y el código de aval 4ACC37.

media Hugging Face Forums · hace 3 h

Temas teóricos más fascinantes de IA con base en sistemas de IA realistas

El debate explora temas teóricos de IA que tienen fundamentos matemáticos y una implementación plausible en sistemas de IA actuales, como los modelos de lenguaje grandes. Los temas incluyen cadenas de razonamiento, grafos de conocimiento y razonamiento probabilístico, todos los cuales están arraigados en matemáticas formales y muestran potencial para aplicaciones de IA en el mundo real.

media Hugging Face Forums · hace 3 h

Sistema de Compañeros: Monitor de entropía en Rust con incertidumbre controlada por NER para inferencia LLM escalonada

El Sistema de Compañeros utiliza un monitor de entropía en Rust para detectar la incertidumbre por token en la inferencia local de Gemma 3 4B, enrutando solo los tokens inciertos a Sonnet mediante extracción de fragmentos controlada por NER y recuperación semántica. Los benchmarks muestran que logra una precisión del 71,4 % a $0,21, superando al patrón Anthropic Advisor (62,9 % a $0,44) en siete conjuntos de datos de Hugging Face, con una mejora clave en SQuAD v2 al enrutar fragmentos del pasaje fuente al modelo en la nube.

media Hugging Face Forums · hace 3 h

El proxy de Hugging Face Spaces elimina el encabezado de credenciales CORS en la preflight OPTIONS

Los usuarios informan que el proxy de borde de Hugging Face Spaces ahora está eliminando el encabezado Access-Control-Allow-Credentials de las solicitudes de preflight OPTIONS, incluso cuando se configura explícitamente en el middleware de Express. El encabezado falta en las respuestas a pesar del código que lo establece e incluye un middleware comodín para las solicitudes OPTIONS, lo que sugiere que el proxy intercepta y modifica la respuesta antes de que llegue al contenedor backend.

media Hugging Face Forums · hace 3 h

BenchHub lanza una actualización importante al espacio de tablas de clasificación abiertas

BenchHub ha lanzado una actualización importante a su plataforma de tablas de clasificación abiertas, que ahora cubre tareas de visión, audio y PLN con métricas consistentes y puntuaciones reproducibles. La plataforma cuenta con 95 tablas, más de 700 presentaciones de modelos y permite la participación gratuita mediante inicio de sesión con GitHub, Google o Hugging Face, con exploración completa y comparaciones de muestras disponibles en runbenchhub.com.