Todos los artículos — korshunov.ai

Todos los artículos Página 5 / 13

Ejecuta un servidor vLLM en HF Jobs con un solo comando

Hugging Face ha presentado una nueva función que permite a los usuarios desplegar servidores vLLM directamente a través de la plataforma Hugging Face Jobs utilizando un único comando.

lab Hugging Face Blog · hace 6 h

Análisis de la precisión en la predicción de tokens en modelos lingüísticos híbridos

Un estudio reciente investiga qué tokens específicos son predichos con mayor precisión por los modelos lingüísticos híbridos en comparación con las arquitecturas densas estándar. La investigación se centra en comprender la distribución de los errores de predicción entre diferentes tipos de tokens, como palabras raras y fragmentos de código. Al analizar los paisajes de pérdida, los autores identifican que los modelos híbridos destacan en la captura de dependencias a largo plazo en regiones de datos dispersos. Los hallazgos sugieren que el mecanismo de mezcla de expertos permite una utilización más eficiente de los parámetros durante la inferencia. Esta mejora en la precisión es particularmente notable para los tokens con baja frecuencia en el corpus de entrenamiento. El artículo proporciona un desglose detallado de las métricas de rendimiento en varios conjuntos de datos de referencia. Estos resultados destacan el potencial de las arquitecturas híbridas para manejar eficazmente estructuras lingüísticas diversas.

lab Hugging Face Blog · hace 6 h

Presentación del Tablero de Clasificación FFASR: Evaluación de ASR en el Mundo Real

El Tablero de Clasificación FFASR se lanzó para evaluar sistemas de reconocimiento de voz en condiciones del mundo real. Proporciona una referencia para evaluar el rendimiento de modelos de reconocimiento automático de voz en diversos entornos y casos de uso.

lab Hugging Face Blog · hace 6 h

NeMo AutoModel de NVIDIA acelera el ajuste fino de transformadores

El NeMo AutoModel de NVIDIA permite un ajuste fino más rápido de modelos de transformadores mediante la automatización de la selección y optimización del modelo. Reduce el tiempo de desarrollo y mejora la eficiencia en el entrenamiento de modelos de lenguaje grandes en hardware de NVIDIA.

lab Hugging Face Blog · hace 6 h

Prueba de la API de almacenamiento entre orígenes en Transformers.js

Transformers.js ha comenzado a experimentar con la propuesta API de almacenamiento entre orígenes. La iniciativa tiene como objetivo habilitar el intercambio seguro de datos entre orígenes en aplicaciones web sin requerir interacción del usuario ni permisos explícitos.

media Together AI Blog · hace 6 h

Los LLM de vanguardia tienen dificultades para escribir núcleos multi-GPU rápidos

ParallelKernelBench evalúa a los LLM en la escritura de núcleos CUDA multi-GPU rápidos para 87 cargas de trabajo reales. El modelo principal genera núcleos que rinden menos de un tercio de la velocidad de las implementaciones óptimas, aunque algunas salidas superan a cualquier código público existente.

lab Hugging Face Blog · hace 6 h

Construye aplicaciones reales con agentes usando CUGA: 24 ejemplos funcionales

CUGA presenta un marco de trabajo ligero que permite a los desarrolladores construir aplicaciones reales con agentes. Incluye 24 ejemplos funcionales que demuestran implementaciones prácticas en diversos casos de uso.

lab Hugging Face Blog · hace 6 h

Hemos logrado que los modelos locales realicen el triaje del repositorio de OpenClaw de forma GRATUITA

OpenClaw ha lanzado una iniciativa gratuita para utilizar modelos de IA locales en el triaje de su repositorio. Esto permite a los colaboradores de la comunidad gestionar de manera eficiente los problemas y las solicitudes de extracción sin depender de servicios externos. El esfuerzo tiene como objetivo mejorar la transparencia y la accesibilidad en el mantenimiento de proyectos de código abierto.

lab Hugging Face Blog · hace 6 h

Publicación semanal de huggingface_hub con IA, herramientas abiertas y supervisión humana

Hugging Face está lanzando huggingface_hub semanalmente, integrando modelos de IA, herramientas de código abierto y un proceso de revisión humana para garantizar la calidad y la seguridad. La actualización enfatiza la transparencia, la participación de la comunidad y el desarrollo responsable de la IA mediante una validación continua con humanos en el bucle.

lab Hugging Face Blog · hace 6 h

PP-OCRv6 lanzado en Hugging Face con soporte para 50 idiomas

PP-OCRv6, un nuevo modelo de reconocimiento óptico de caracteres, ya está disponible en Hugging Face. Admite 50 idiomas y escala desde 1,5 millones hasta 34,5 millones de parámetros, ofreciendo mayor precisión y eficiencia en diversos idiomas.

github CrewAI · hace 6 h

Notas de la versión 1.15.0 de crewAI

La versión 1.15.0 de crewAI introduce mejoras significativas en las definiciones de Flow, incluyendo carga declarativa unificada, soporte para crews en línea y nuevas acciones compuestas como `each` y acciones de agente único.

lab Hugging Face Blog · hace 7 h

¿Puedes superar a LoRA en el ajuste fino?

Un nuevo estudio explora alternativas a LoRA, la técnica de ajuste fino más popular, evaluando si otros métodos pueden lograr un mejor rendimiento con menor costo computacional. La investigación encuentra que, aunque algunos enfoques muestran potencial, ninguno supera consistentemente a LoRA en diversas tareas y conjuntos de datos.

github AutoGPT · hace 7 h

Notas de la versión Beta v0.6.65 de AutoGPT Platform

La plataforma AutoGPT ha lanzado la versión 0.6.65, introduciendo actualizaciones significativas en el sistema Copilot, la navegación de la interfaz de usuario y la fiabilidad de la infraestructura.

github llama.cpp · hace 7 h

Liberación de llama.cpp b9803 con corrección de perfilado en OpenCL

El proyecto llama.cpp ha lanzado la versión b9803, que incluye una corrección para OpenCL que vacía los lotes de perfilado al apagar el sistema para lotes incompletos. Esta actualización proporciona binarios para macOS, Linux, Windows, Android y openEuler a través de varios backends de hardware.

lab Hugging Face Blog · hace 7 h

MosaicLeaks: ¿Puede tu agente de investigación guardar un secreto?

MosaicLeaks ha publicado un informe que cuestiona si los agentes de investigación pueden mantener la confidencialidad de manera fiable. El informe destaca preocupaciones sobre la exposición de datos y la confianza en las herramientas de investigación impulsadas por IA. Pide medidas de privacidad más sólidas y transparencia en cómo estos agentes manejan información sensible.

github Goose (Block) · hace 7 h

v1.39.0

Esta versión intenta corregir la compilación de Flatpak.

github CrewAI · hace 7 h

Notas de la versión 1.14.8a5 de crewAI

La actualización de crewAI versión 1.14.8a5 introduce cambios en la gestión del estado del flujo, actualizaciones de documentación y esfuerzos de refactorización.

github LlamaIndex · hace 7 h

Notas de la versión 0.14.23 de Llama Index

Llama Index lanzó la versión 0.14.23 el 24 de junio de 2026, introduciendo capacidades multimodales significativas y varias correcciones de errores. La actualización central incluye características de síntesis multimodal y la introducción de motores de consulta multimodales para admitir diversos tipos de datos. Las correcciones clave abordan el manejo de bloques de documentos y video dentro de las salidas de FunctionTool y aseguran que los bloques de memoria respaldados por URL se conserven correctamente. Se implementaron mejoras de rendimiento mediante el uso de conjuntos para la deduplicación dentro del lote en la canalización de ingestión y optimizando la lógica de división de texto de tokens. La versión también resuelve un ZeroDivisionError en secuencias de entrada vacías y corrige errores de recursión en los divisores cuando las unidades superan los tamaños de fragmento. Además, se agregó codificación UTF-8 explícita a las operaciones de E/S de archivos, y la copia profunda de los estados iniciales evita fugas de mutación entre ejecuciones del flujo de trabajo.

github CrewAI · hace 7 h

Notas de la versión v1.14.8a4

v1.14.8a4 agrega soporte para el flujo conversacional en la CLI TUI. Incluye correcciones para la traversión de rutas de enlaces simbólicos durante la extracción y validación de archivos de habilidades, y la validación de las rutas de definición de flujo declarativo. La documentación de v1.14.8a3 está actualizada.

github CrewAI · hace 7 h

Notas de la versión 1.14.8a3 de CrewAI

CrewAI 1.14.8a3 introduce la carga unificada de flujos declarativos y una mejor experiencia de usuario en el inicio para las ejecuciones de crew. Consolidar los comandos 'crewai run' y 'flow kickoff', añade soporte CLI declarativo para Flow, y habilita @router() como método de inicio del flujo con esquemas de salida tipados para herramientas.