Todos los artículos
media Hugging Face Forums · hace 1 d

Usuarios reportan indisponibilidad de la herramienta y del servidor MCP para Step 3.7 Flash en HuggingChat

Un usuario en los foros de Hugging Face informó que el modelo Step 3.7 Flash perdió la capacidad de usar herramientas y conectarse a servidores MCP a partir de esa mañana. El autor expresó gran satisfacción con el rendimiento del modelo, destacando su alta calidad en relación con su bajo consumo de recursos y costo. Enfatizó su deseo de continuar utilizando este modelo específico en lugar de cambiar a alternativas debido a su eficiencia. El usuario preguntó explícitamente si esta pérdida de funcionalidad es permanente y si hay algún paso que pueda tomar para restaurar el acceso. La publicación destaca la preocupación de la comunidad por la interrupción repentina de las capacidades de herramientas para un modelo popular y rentable.

media r/LocalLLaMA · hace 1 d

AeroLLM: aplicación de IA rápida y de código abierto para Apple Silicon

AeroLLM es una aplicación de chat rápida, optimizada y de código abierto diseñada para dispositivos con Apple Silicon que utiliza el backend MLX. Admite tareas de IA locales como texto a voz, voz a texto y modelos de lenguaje grandes, con modelos descargados directamente desde Hugging Face según la RAM disponible. La aplicación está notariada debido a la falta de membresía en Apple Developer, pero los usuarios pueden seguir los pasos proporcionados para ejecutarla como una app firmada en macOS.

media r/LocalLLaMA · hace 1 d

¿Son los modelos locales pequeños para automatización una tendencia?

Un usuario de Reddit argumenta que los LLM locales pequeños y eficientes (de 1B a 4B parámetros) integrados en scripts pueden habilitar la automatización práctica de tareas repetitivas. Señala que este caso de uso está subrepresentado en las discusiones centradas en asistentes de codificación o rendimiento de hardware, lo que sugiere una brecha en el interés de la comunidad o la visibilidad de los modelos de IA ligeros y específicos para tareas.

blog Simon Willison · hace 1 d

Las restricciones de exportación de Fable 5 perjudican la ciberdefensa de EE. UU.

Claude Fable 5 fue prohibido bajo las restricciones de exportación después de que investigadores demostraran que podía 'arreglar' código con vulnerabilidades conocidas. El modelo generó correctamente parches y scripts de prueba para fallos de seguridad, una capacidad esencial para la ciberseguridad defensiva. Los investigadores argumentan que esta es una función de seguridad legítima, no una amenaza, y que prohibir tales modelos socava la ciberdefensa en el mundo real.

media r/LocalLLaMA · hace 1 d

¿Alguna ventaja en una configuración con múltiples máquinas para LLM locales?

Los usuarios han preguntado si ejecutar varias máquinas en paralelo proporciona ventajas para el manejo de contextos más grandes o una inferencia más rápida en modelos de lenguaje grande (LLM) locales. Si bien las máquinas individuales pueden manejar contextos más grandes con suficiente RAM, no existe un avance establecido que permita ganancias significativas de rendimiento al distribuir la inferencia entre múltiples máquinas para LLM locales.

media r/LocalLLaMA · hace 1 d

¿Siguen siendo los modelos de generación de imágenes cuantizados un trabajo en progreso?

Los usuarios reportan resultados inconsistentes al utilizar modelos cuantizados en la generación de imágenes, con SD 1.5 funcionando bien pero SDXL fallando. A pesar de una conversión y cuantización exitosas utilizando herramientas como convert.py y llama-quantize, algunos usuarios obtienen salidas de mala calidad mientras que otros no, lo que plantea preguntas sobre el estado actual y la fiabilidad de la tecnología de generación de imágenes cuantizada.

arxiv arXiv cs.CL · hace 1 d

CKA de Diferencia Contrastiva Revela Alineación Específica de Conceptos a Través de Arquitecturas de LLM

Un diagnóstico sin entrenamiento, CKA de diferencia contrastiva (CKA_Delta), identifica alineación estructural específica de conceptos a través de arquitecturas de modelos de lenguaje. Detecta convergencia geométrica y transferencia funcional en seis dominios conceptuales, incluyendo tareas no instruccionales, con discriminación significativa donde el CKA estándar falla. Los resultados sugieren que la universalidad puede fortalecerse con la escala del modelo, aunque se necesita más validación.

arxiv arXiv cs.CL · hace 1 d

LOGOS: Un modelo generativo de propósito general para las ciencias naturales

LOGOS es un modelo de lenguaje generativo unificado que representa objetos científicos y sus interacciones como secuencias de tokens en una gramática compartida. Logra un rendimiento consistente o superior en diversas tareas de ciencias naturales, demostrando la viabilidad de un único modelo que sirva a múltiples dominios. El modelo escala positivamente con el número de parámetros, y su diseño sugiere que la IA para la ciencia debería alinearse profundamente con los grandes modelos de lenguaje a través de arquitecturas compartidas y entrenamiento.