Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 12

Acceso a la API de Llama 3.1 70B restringido al probador de Hugging Face

Los usuarios pueden acceder al modelo Llama 3.1 70B a través del probador de Hugging Face, pero reciben un error "Modelo no compatible con el proveedor" al usar aplicaciones de terceros o curl. El modelo está actualmente disponible únicamente a través de la interfaz de Hugging Face y no se expone mediante puntos de conexión de API públicos.

media Hugging Face Forums · hace 2 h

Las incrustaciones binarias nativas superan a la binarización posterior al entrenamiento

Un experimento a pequeña escala muestra que los modelos de incrustación binaria nativa logran un mejor rendimiento en recuperación que la binarización posterior al entrenamiento de modelos de punto flotante. En Recall@10 de SciFact, los modelos binarios nativos (de 2048 y 4096 dimensiones) superan a los modelos binarios posteriores al entrenamiento en un 17 % y un 25 %, respectivamente, con ventajas significativas en velocidad y memoria durante la indexación.

media Hugging Face Forums · hace 2 h

Los tokens de Spaces dejan de funcionar tras la actualización

Los usuarios informan que los tokens de Spaces ya no funcionan después de una actualización reciente. No se están guardando los archivos generados, lo que interrumpe el flujo de trabajo y la ejecución del modelo.

media Hugging Face Forums · hace 2 h

Buscando aval de cs.LG en arXiv para el Optimizador PsiLogic

Ali, un investigador independiente de 16 años, ha desarrollado PsiLogic, un optimizador de cancelación activa consciente del caos basado en Adam. Evaluado frente a AdamW y Lion utilizando FairBench en una NVIDIA H100, PsiLogic logró las mejores métricas de validación en tres de cuatro tareas y empató estadísticamente en la cuarta, aunque implica una sobrecarga por paso. El autor busca un aval para la presentación en arXiv bajo cs.LG, proporcionando un repositorio de GitHub y el código de aval 4ACC37.

media Hugging Face Forums · hace 2 h

Los tokens de Spaces ya no funcionan y los archivos no se guardan

Tras una actualización reciente de Hugging Face, los tokens de Spaces dejaron de funcionar, lo que provocó errores 404 al intentar guardar los archivos generados. El proceso se completa con éxito hasta el 100 %, pero falla durante la fase de guardado debido a errores de token, consumiendo créditos de ZeroGPU sin producir ninguna salida guardada.

media Hugging Face Forums · hace 2 h

Temas teóricos más fascinantes de IA con base en sistemas de IA realistas

El debate explora temas teóricos de IA que tienen fundamentos matemáticos y una implementación plausible en sistemas de IA actuales, como los modelos de lenguaje grandes. Los temas incluyen cadenas de razonamiento, grafos de conocimiento y razonamiento probabilístico, todos los cuales están arraigados en matemáticas formales y muestran potencial para aplicaciones de IA en el mundo real.

media Hugging Face Forums · hace 2 h

¿El servicio de WA del banco BNI está disponible las 24 horas? Este es el número de la central telefónica

El servicio helo del banco BNI a través de WhatsApp opera las 24 horas del día, los 7 días de la semana. El número de la central telefónica al que se puede llamar es 085121555844.

media Hugging Face Forums · hace 2 h

Mi cuenta de Hugging Face fue bloqueada

Un usuario informa que su cuenta de Hugging Face, AntixStudioDesign, fue bloqueada inesperadamente durante la experimentación con herramientas de IA. Ha contactado al Equipo de Seguridad por correo electrónico y busca asesoramiento sobre la recuperación de la cuenta, el tiempo de respuesta y las opciones de preservación de datos.

media Hugging Face Forums · hace 2 h

Sistema de Compañeros: Monitor de entropía en Rust con incertidumbre controlada por NER para inferencia LLM escalonada

El Sistema de Compañeros utiliza un monitor de entropía en Rust para detectar la incertidumbre por token en la inferencia local de Gemma 3 4B, enrutando solo los tokens inciertos a Sonnet mediante extracción de fragmentos controlada por NER y recuperación semántica. Los benchmarks muestran que logra una precisión del 71,4 % a $0,21, superando al patrón Anthropic Advisor (62,9 % a $0,44) en siete conjuntos de datos de Hugging Face, con una mejora clave en SQuAD v2 al enrutar fragmentos del pasaje fuente al modelo en la nube.

media Hugging Face Forums · hace 2 h

Modelo de música con IA se ejecuta en tiempo real en la mayoría de las CPU dentro del navegador

NanoMaestro Realtime es un modelo de música con IA de 50 MB con 13M parámetros que genera música de piano en tiempo real utilizando una LSTM de 2 capas. Se ejecuta localmente en el navegador a través de ONNX y Transformers.js con WASM, sin requerir GPU ni backend de servidor, y funciona en modelos antiguos de Raspberry Pi.

media Hugging Face Forums · hace 2 h

El error de estado 'Starting' está completamente corregido

Hugging Face ha resuelto un fallo de sincronización en la interfaz de usuario que hacía que los modelos mostraran 'Starting' en lugar de 'Running'. El problema era exclusivamente de latencia en la interfaz, sin requerir cambios en el backend. Los usuarios ahora ven cómo los modelos transicionan suavemente a 'Running', con el punto verde restaurado.

media Hugging Face Forums · hace 2 h

El proxy de Hugging Face Spaces elimina el encabezado de credenciales CORS en la preflight OPTIONS

Los usuarios informan que el proxy de borde de Hugging Face Spaces ahora está eliminando el encabezado Access-Control-Allow-Credentials de las solicitudes de preflight OPTIONS, incluso cuando se configura explícitamente en el middleware de Express. El encabezado falta en las respuestas a pesar del código que lo establece e incluye un middleware comodín para las solicitudes OPTIONS, lo que sugiere que el proxy intercepta y modifica la respuesta antes de que llegue al contenedor backend.

media Hugging Face Forums · hace 2 h

Los componentes web de Gradio fallan al cargarse

Los componentes web de Gradio están fallando al cargarse en sitios web, mostrando un error sobre un nombre de repositorio inválido debido a barras codificadas en la URL. El problema ocurre al cargar espacios de Hugging Face mediante componentes web de Gradio, a pesar de funcionar directamente en el espacio de HF.

media Hugging Face Forums · hace 3 h

BenchHub lanza una actualización importante al espacio de tablas de clasificación abiertas

BenchHub ha lanzado una actualización importante a su plataforma de tablas de clasificación abiertas, que ahora cubre tareas de visión, audio y PLN con métricas consistentes y puntuaciones reproducibles. La plataforma cuenta con 95 tablas, más de 700 presentaciones de modelos y permite la participación gratuita mediante inicio de sesión con GitHub, Google o Hugging Face, con exploración completa y comparaciones de muestras disponibles en runbenchhub.com.

media Hugging Face Forums · hace 3 h

Búsqueda de conjuntos de datos de documentos en lenguas indias para entrenamiento de IA/OCR en India

QuantVectors está buscando conjuntos de datos de documentos anotados en lenguas indias de la India, incluyendo hindi, maratí, guyaratí, bengalí, punjabi, tamil, urdu, telugu, oriya, kannada, malayalam y asamés. Los conjuntos de datos deben incluir tipos de facturas, recibos, facturas de servicios públicos, avisos de pago, listas de empaque, facturas comerciales y notas de crédito, con aproximadamente 400 documentos por idioma, anotaciones verificadas por humanos y una precisión del 99%+. Los conjuntos de datos deben ser licenciables comercialmente y pueden ser de código abierto o comerciales, solicitando conjuntos de datos de HuggingFace, conjuntos de datos de investigación o proveedores especializados en este ámbito.

media Hugging Face Forums · hace 3 h

Espacio marcado como abusivo por una regla de Cloudflare

Hugging Face ha pausado el espacio sainstore-QC/quality-hub, citando una regla de abuso de Cloudflare. El usuario informa que la marca se emitió el 2026-06-17, el espacio sigue en pausa y los intentos de reinicio fallan a pesar de eliminar los archivos sospechosos del desencadenante y enviar un commit limpio.

media Hugging Face Forums · hace 3 h

Modelos sustitutos de ML en CFD/MEF: Prácticas y desafíos del mundo real

Los profesionales de la ingeniería informan que las redes neuronales gráficas y los MLP en diseños parametrizados ofrecen el mejor equilibrio práctico para predecir campos como temperatura y tensión. La eficiencia de datos es alcanzable con 10–50 muestras de entrenamiento, especialmente cuando se aplica aprendizaje por transferencia entre geometrías similares. Las redes neuronales informadas por física (PINNs) siguen siendo principalmente experimentales para geometrías de ingeniería complejas, con la mayoría de los usuarios dependiendo de sustitutos basados en datos. La generalización sigue siendo un desafío clave, ya que los modelos a menudo fallan en condiciones de frontera fuera de la distribución, lo que impulsa un retorno a ejecuciones completas del solucionador.

media Hugging Face Forums · hace 3 h

¿Qué tendencia de IA tendrá el mayor impacto en los próximos cinco años?

Una discusión en Hugging Face pregunta qué tendencia del desarrollo de IA afectará más significativamente a las empresas, los empleos o la vida cotidiana dentro de los próximos cinco años. Se invita a los participantes a compartir sus opiniones sobre las tecnologías emergentes de IA y su posible impacto en el mundo real.

media Hugging Face Forums · hace 3 h

Construí un nuevo LLM triple-híbrido de menos de 1B parámetros por ~$50

Mateusz ha desarrollado un modelo de lenguaje completamente preentrenado, Titan v1 de Project Inkblot, que combina Mamba SSM, Atención Multi-Cabeza y MoE de 32 expertos en una única arquitectura solo-decoder con menos de 1B parámetros. El modelo, entrenado en una única GPU NVIDIA L4 por ~$50, alcanza una perplejidad de validación de 27.5 y demuestra un escalado eficiente mediante una actualización de configuración de una sola línea, con todos los componentes implementados desde cero en PyTorch. El primer ciclo de entrenamiento de Titan v2 ya está completo y la expansión del conjunto de datos está en curso.

media Hugging Face Forums · hace 3 h

La capacidad no está en los pesos: resultado empírico negativo sobre la proyección de pesos de MLP

Un estudio empírico encontró que proyectar los pesos de MLP de un modelo transformer a otro no logra transferir la capacidad semántica. Cada variante probada obtuvo peores resultados que el modelo anfitrión sin modificar, lo que indica una limitación estructural en la proyección de pesos. Los resultados cuestionan las afirmaciones públicas sobre las capacidades de los modelos basadas en benchmarks, mostrando que dichas afirmaciones no reflejan la geometría interna real de los pesos.