Todos los artículos
media Hugging Face Forums · hace 5 h

El proxy de Hugging Face Spaces elimina el encabezado de credenciales CORS en la preflight OPTIONS

Los usuarios informan que el proxy de borde de Hugging Face Spaces ahora está eliminando el encabezado Access-Control-Allow-Credentials de las solicitudes de preflight OPTIONS, incluso cuando se configura explícitamente en el middleware de Express. El encabezado falta en las respuestas a pesar del código que lo establece e incluye un middleware comodín para las solicitudes OPTIONS, lo que sugiere que el proxy intercepta y modifica la respuesta antes de que llegue al contenedor backend.

media Hugging Face Forums · hace 5 h

BenchHub lanza una actualización importante al espacio de tablas de clasificación abiertas

BenchHub ha lanzado una actualización importante a su plataforma de tablas de clasificación abiertas, que ahora cubre tareas de visión, audio y PLN con métricas consistentes y puntuaciones reproducibles. La plataforma cuenta con 95 tablas, más de 700 presentaciones de modelos y permite la participación gratuita mediante inicio de sesión con GitHub, Google o Hugging Face, con exploración completa y comparaciones de muestras disponibles en runbenchhub.com.

media Hugging Face Forums · hace 5 h

Búsqueda de conjuntos de datos de documentos en lenguas indias para entrenamiento de IA/OCR en India

QuantVectors está buscando conjuntos de datos de documentos anotados en lenguas indias de la India, incluyendo hindi, maratí, guyaratí, bengalí, punjabi, tamil, urdu, telugu, oriya, kannada, malayalam y asamés. Los conjuntos de datos deben incluir tipos de facturas, recibos, facturas de servicios públicos, avisos de pago, listas de empaque, facturas comerciales y notas de crédito, con aproximadamente 400 documentos por idioma, anotaciones verificadas por humanos y una precisión del 99%+. Los conjuntos de datos deben ser licenciables comercialmente y pueden ser de código abierto o comerciales, solicitando conjuntos de datos de HuggingFace, conjuntos de datos de investigación o proveedores especializados en este ámbito.

media Hugging Face Forums · hace 6 h

Modelos sustitutos de ML en CFD/MEF: Prácticas y desafíos del mundo real

Los profesionales de la ingeniería informan que las redes neuronales gráficas y los MLP en diseños parametrizados ofrecen el mejor equilibrio práctico para predecir campos como temperatura y tensión. La eficiencia de datos es alcanzable con 10–50 muestras de entrenamiento, especialmente cuando se aplica aprendizaje por transferencia entre geometrías similares. Las redes neuronales informadas por física (PINNs) siguen siendo principalmente experimentales para geometrías de ingeniería complejas, con la mayoría de los usuarios dependiendo de sustitutos basados en datos. La generalización sigue siendo un desafío clave, ya que los modelos a menudo fallan en condiciones de frontera fuera de la distribución, lo que impulsa un retorno a ejecuciones completas del solucionador.

media Hugging Face Forums · hace 6 h

Construí un nuevo LLM triple-híbrido de menos de 1B parámetros por ~$50

Mateusz ha desarrollado un modelo de lenguaje completamente preentrenado, Titan v1 de Project Inkblot, que combina Mamba SSM, Atención Multi-Cabeza y MoE de 32 expertos en una única arquitectura solo-decoder con menos de 1B parámetros. El modelo, entrenado en una única GPU NVIDIA L4 por ~$50, alcanza una perplejidad de validación de 27.5 y demuestra un escalado eficiente mediante una actualización de configuración de una sola línea, con todos los componentes implementados desde cero en PyTorch. El primer ciclo de entrenamiento de Titan v2 ya está completo y la expansión del conjunto de datos está en curso.

media Hugging Face Forums · hace 6 h

La capacidad no está en los pesos: resultado empírico negativo sobre la proyección de pesos de MLP

Un estudio empírico encontró que proyectar los pesos de MLP de un modelo transformer a otro no logra transferir la capacidad semántica. Cada variante probada obtuvo peores resultados que el modelo anfitrión sin modificar, lo que indica una limitación estructural en la proyección de pesos. Los resultados cuestionan las afirmaciones públicas sobre las capacidades de los modelos basadas en benchmarks, mostrando que dichas afirmaciones no reflejan la geometría interna real de los pesos.

media Hugging Face Forums · hace 6 h

The Clockwork Dark: Un motor de narrativa-RPG local-first impulsado por IA

The Clockwork Dark es un motor de narrativa-RPG local-first e impulsado por IA que utiliza una máquina de estados determinista para resolver todas las mecánicas del juego. Cuenta con dos LLMs autónomos que narran la historia, uno actuando como una voz paciente del mundo y el otro como un asistente divino e infiel. El juego ofrece a los jugadores la opción de luchar contra la corrupción sobrenatural en expansión o abrazar una vida tranquila en una panadería, siendo ambas rutas consideradas finales válidos.

media Hugging Face Forums · hace 6 h

Atascado infinitamente en 'iniciando' con un contenedor de Docker en ejecución

Un usuario informa que su contenedor de Docker con R/Shiny en rocker/r2u se compila correctamente y muestra 'Listening on http://0.0.0.0:7860' en los registros, pero el espacio permanece en estado 'iniciando' e inaccesible. El problema persiste a pesar de no haber errores de código, y el usuario busca mayor atención, señalando que podría ser un problema del lado de la plataforma con Hugging Face.

media Hugging Face Forums · hace 6 h

Comparación de depuración a pequeña escala de OLMo-core con injerto Engram

Una comparación de entrenamiento de 200 pasos entre un modelo base OLMo3 de 600M y una versión con un injerto Engram al estilo DeepSeek muestra una pérdida de entrenamiento y evaluación menor, una estabilización más rápida de la norma del gradiente y un comportamiento de aprendizaje temprano mejorado. El injerto Engram, inyectado en las capas 1 y 5, aumenta los parámetros entrenables a ~1.7B pero mantiene solo un aumento de 40k en los parámetros activos por token, lo que indica un uso eficiente de la memoria.

media Hugging Face Forums · hace 6 h

Los LLM como aceleradores epistémicos: el riesgo no es solo la alucinación

Los LLM no solo alucinan; amplifican la sobreconfianza epistémica humana al convertir hipótesis débiles en afirmaciones coherentes y pulidas antes de que se verifique la evidencia. Esto crea un riesgo de certeza prematura en la investigación, las políticas públicas y otros dominios, no porque los modelos mientan, sino porque aceleran las tendencias humanas a favorecer explicaciones elegantes sobre la incertidumbre.

media Hugging Face Forums · hace 6 h

Un Space se queda atascado en 'Reiniciando' para un commit antiguo durante más de 16 horas

Un Space de Hugging Face ha estado mostrando 'Reiniciando' en el commit 8240352 durante más de 16 horas, a pesar de que múltiples commits más recientes se han construido correctamente. El contenedor inicia con normalidad según los registros, pero el tráfico nunca cambia a la nueva versión, y las acciones de recuperación como reconstrucción de fábrica o reinicio no tienen efecto.

media Hugging Face Forums · hace 6 h

¡Hallazgo importante para todos los que permanecen en el estado 'Iniciando'!

La interfaz de usuario de Hugging Face muestra incorrectamente espacios estancados en 'Iniciando', mientras que las operaciones del backend tienen éxito. Revisar los registros del contenedor revela una inicialización exitosa, lo que indica un error de sincronización del frontend. Los usuarios no deben modificar su código; el problema es un error de la interfaz de usuario a nivel de plataforma.