Todos los artículos — korshunov.ai — noticias de ML

Todos los artículos Página 3 / 13

media Hugging Face Forums · hace 5 h

Usuarios reportan que HuggingFace cobra por compute L40S no utilizado en Spaces

Un usuario en el foro de discusión de Hugging Face informó un problema donde su Space se quedó atascado en la fase de inicio mientras usaba una GPU L40S. El usuario expresó frustración por ser cobrado por recursos de computación a pesar de que la aplicación no lograba iniciarse ni utilizar ninguna potencia de procesamiento real. Este incidente destaca preocupaciones sobre la transparencia de facturación y la confiabilidad de la infraestructura dentro del entorno Spaces de la plataforma. La publicación sirve como una queja por pérdidas financieras debido a fallos técnicos, en lugar de un anuncio de función. No se incluyeron más detalles técnicos ni respuestas oficiales en el contenido fuente truncado.

media Hugging Face Forums · hace 5 h

Usuario pregunta sobre el proceso de cambio de nombre de organización en Hugging Face

Un usuario publicó en el foro de discusión de Hugging Face buscando ayuda para renombrar su organización. El individuo indicó que envió un correo electrónico a website@huggingface.co el 15 de junio solicitando un cambio de DZER-Studios a Vexion-LM. A pesar de enviar la solicitud inicial, el usuario informó no haber recibido respuesta y observó que el nombre de la organización permaneció sin cambios. En consecuencia, el autor preguntó si las plataformas aún admiten el cambio de nombre de organizaciones. También solicitó orientación sobre métodos alternativos para contactar al equipo respecto a esta solicitud administrativa específica.

media Hugging Face Forums · hace 5 h

Usuarios reportan fallo de acceso a la herramienta de herramientas del modelo Flash 3.7 en HuggingChat

Un usuario en el foro de discusión de Hugging Face informó que el modelo Flash 3.7 de StepFun AI ha perdido su capacidad de utilizar herramientas, incluidos los servidores MCP, desde la mañana del reporte. El individuo expresó preocupación sobre si esta interrupción es temporal o permanente, señalando su fuerte preferencia por este modelo específico debido a su alto rendimiento y bajos costos de recursos en comparación con los competidores. A pesar de elogiar la calidad y asequibilidad del modelo, el usuario destacó la interrupción inmediata causada por la incapacidad de ejecutar funciones basadas en herramientas. La publicación busca aclaraciones de la comunidad sobre experiencias previas con problemas similares y posibles soluciones. Este incidente subraya una dependencia crítica de la disponibilidad de herramientas para los usuarios que dependen de esta configuración específica de IA.

media Hugging Face Forums · hace 5 h

Inversión ontológica: invertir los conceptos emocionales de los LLMs mediante ganancia negativa

El autor introduce la 'inversión ontológica', una técnica diseñada para ampliar la naturaleza de inferencia unidireccional de los Modelos de Lenguaje Grande. Este método permite a los modelos capturar conceptos matizados y multifacéticos, como recuerdos que evocan simultáneamente tristeza y alegría. El enfoque se desarrolló aplicando un factor de ganancia negativa durante las barridas en la arquitectura de dirección Niodoo. Aborda la limitación común donde los LLMs sobreajustan etiquetas emocionales singulares cuando se les presentan experiencias personales. Al invertir conceptos de manera similar a la involución física, la técnica permite a los modelos invertir estados emocionales, como transformar recuerdos tristes en alegres. El trabajo se comparte a través de un repositorio de GitHub titulado 'ontological-inversion' por el usuario Ruffian-L.

media Hugging Face Forums · hace 5 h

Consulta de la comunidad sobre métodos de evaluación de modelos

Un usuario en el foro de discusión de Hugging Face publicó una pregunta buscando consejos sobre cómo evaluar modelos de aprendizaje automático. La consulta fue iniciada por una persona nueva en el campo del ajuste fino que desea evaluar sus modelos tras completarlos. La publicación pregunta explícitamente por métodos o estrategias establecidos que la comunidad utiliza para este propósito. Destaca una necesidad común entre los profesionales de comprender las prácticas estándar de evaluación en el desarrollo de modelos. El hilo de discusión contiene actualmente solo una publicación de un único participante. No se proporcionaron benchmarks específicos, métricas ni soluciones técnicas dentro del contenido visible de la fuente.

media Hugging Face Forums · hace 5 h

Qwen3/Gemma3 Candle omite las máscaras de atención para lotes de longitud igual en modo CPU

Un usuario ha reportado un error crítico en la biblioteca text-embeddings-inference de Hugging Face que afecta a los modelos Qwen3 y Gemma3. El problema surge al ejecutar inferencia en CPUs con solicitudes concurrentes, lo que provoca una degradación significativa de la precisión. Específicamente, el backend Candle omite incorrectamente las máscaras de atención para lotes donde todas las secuencias de entrada tienen longitudes iguales. Este defecto compromete la fiabilidad de los embeddings generados bajo estas condiciones específicas. Para abordar el problema, el autor presentó una solicitud de extracción (pull request) que contiene una corrección probada exhaustivamente en sus máquinas locales. El error resalta posibles riesgos de estabilidad en servicios de embedding basados en CPU que manejan entradas por lotes.

media Hugging Face Forums · hace 5 h

Prototipo del agente móvil Aiden en desarrollo

Aiden es un dispositivo de agente de IA físico que monitorea la pantalla de un teléfono a través de HDMI y lo controla mediante USB HID, permitiendo la automatización de aplicaciones sin jailbreak ni software instalado. Admite el uso de LLMs propios, opera sin infraestructura de backend ni recopilación de datos, y se publica bajo la licencia AGPL como una placa de desarrollo de código abierto.

media Hugging Face Forums · hace 5 h

Construí un servidor MCP en Go para agentes de IA - Tutorial de 200 líneas

Un tutorial de Go de 200 líneas demuestra la construcción de un servidor ligero del Protocolo de Contexto del Modelo utilizando la concurrencia y simplicidad de Go. El servidor permite que agentes de IA como Claude accedan a datos estructurados y aplicaciones Go, potencialmente haciéndolos 10 veces más útiles.

media Hugging Face Forums · hace 5 h

Mejor modelo para uso local y funcionamiento en Unity con MCP a 12 GB de VRAM

Un usuario busca un LLM ligero adaptado para Unity 6.5 con MCP, que funcione dentro de los 12 GB de VRAM. Actualmente depende de las capas gratuitas de Cursor y Claude, pero las considera insuficientes, preguntando si existen modelos especializados o soluciones alternativas disponibles.

media Hugging Face Forums · hace 5 h

Clasificador de audio Wav2vec2 y WavLM se queda atascado en 33% de precisión

Un usuario informa que el ajuste fino de wav2vec2-base o wavlm-base-plus para la clasificación de audio de 3 clases logra solo un 33% de precisión, igualando los niveles de azar. El modelo se entrena actualizando únicamente la cabeza de clasificación, utilizando clips rellenos de 1.0s de duración sin máscaras de atención, y con una tasa de aprendizaje de 1e-3, lo que lleva a un rendimiento deficiente a pesar del desequilibrio de clases y los clips de entrada cortos.

media Hugging Face Forums · hace 5 h

¿La información del proveedor de inferencia está desactualizada?

La página de Hugging Face para Llama 3.1 405B lista a Featherless AI como un proveedor, pero el widget de prueba muestra 'Error al obtener los datos' y featherless.ai no lo lista como disponible. Se reporta un problema similar para el modelo ERNIE-4.5-300B de Baidu.

media Hugging Face Forums · hace 5 h

Acceso a la API de Llama 3.1 70B restringido al probador de Hugging Face

Los usuarios pueden acceder al modelo Llama 3.1 70B a través del probador de Hugging Face, pero reciben un error "Modelo no compatible con el proveedor" al usar aplicaciones de terceros o curl. El modelo está actualmente disponible únicamente a través de la interfaz de Hugging Face y no se expone mediante puntos de conexión de API públicos.

media Hugging Face Forums · hace 5 h

Las incrustaciones binarias nativas superan a la binarización posterior al entrenamiento

Un experimento a pequeña escala muestra que los modelos de incrustación binaria nativa logran un mejor rendimiento en recuperación que la binarización posterior al entrenamiento de modelos de punto flotante. En Recall@10 de SciFact, los modelos binarios nativos (de 2048 y 4096 dimensiones) superan a los modelos binarios posteriores al entrenamiento en un 17 % y un 25 %, respectivamente, con ventajas significativas en velocidad y memoria durante la indexación.

media Hugging Face Forums · hace 5 h

Los tokens de Spaces dejan de funcionar tras la actualización

Los usuarios informan que los tokens de Spaces ya no funcionan después de una actualización reciente. No se están guardando los archivos generados, lo que interrumpe el flujo de trabajo y la ejecución del modelo.

media Hugging Face Forums · hace 5 h

Buscando aval de cs.LG en arXiv para el Optimizador PsiLogic

Ali, un investigador independiente de 16 años, ha desarrollado PsiLogic, un optimizador de cancelación activa consciente del caos basado en Adam. Evaluado frente a AdamW y Lion utilizando FairBench en una NVIDIA H100, PsiLogic logró las mejores métricas de validación en tres de cuatro tareas y empató estadísticamente en la cuarta, aunque implica una sobrecarga por paso. El autor busca un aval para la presentación en arXiv bajo cs.LG, proporcionando un repositorio de GitHub y el código de aval 4ACC37.

media Hugging Face Forums · hace 5 h

Los tokens de Spaces ya no funcionan y los archivos no se guardan

Tras una actualización reciente de Hugging Face, los tokens de Spaces dejaron de funcionar, lo que provocó errores 404 al intentar guardar los archivos generados. El proceso se completa con éxito hasta el 100 %, pero falla durante la fase de guardado debido a errores de token, consumiendo créditos de ZeroGPU sin producir ninguna salida guardada.

media Hugging Face Forums · hace 5 h

Temas teóricos más fascinantes de IA con base en sistemas de IA realistas

El debate explora temas teóricos de IA que tienen fundamentos matemáticos y una implementación plausible en sistemas de IA actuales, como los modelos de lenguaje grandes. Los temas incluyen cadenas de razonamiento, grafos de conocimiento y razonamiento probabilístico, todos los cuales están arraigados en matemáticas formales y muestran potencial para aplicaciones de IA en el mundo real.

media Hugging Face Forums · hace 5 h

¿El servicio de WA del banco BNI está disponible las 24 horas? Este es el número de la central telefónica

El servicio helo del banco BNI a través de WhatsApp opera las 24 horas del día, los 7 días de la semana. El número de la central telefónica al que se puede llamar es 085121555844.

media Hugging Face Forums · hace 5 h

Mi cuenta de Hugging Face fue bloqueada

Un usuario informa que su cuenta de Hugging Face, AntixStudioDesign, fue bloqueada inesperadamente durante la experimentación con herramientas de IA. Ha contactado al Equipo de Seguridad por correo electrónico y busca asesoramiento sobre la recuperación de la cuenta, el tiempo de respuesta y las opciones de preservación de datos.

media Hugging Face Forums · hace 5 h

Sistema de Compañeros: Monitor de entropía en Rust con incertidumbre controlada por NER para inferencia LLM escalonada

El Sistema de Compañeros utiliza un monitor de entropía en Rust para detectar la incertidumbre por token en la inferencia local de Gemma 3 4B, enrutando solo los tokens inciertos a Sonnet mediante extracción de fragmentos controlada por NER y recuperación semántica. Los benchmarks muestran que logra una precisión del 71,4 % a $0,21, superando al patrón Anthropic Advisor (62,9 % a $0,44) en siete conjuntos de datos de Hugging Face, con una mejora clave en SQuAD v2 al enrutar fragmentos del pasaje fuente al modelo en la nube.