Todos los artículos
arxiv arXiv cs.AI · hace 2 h

Filtrado de grafos eficiente en memoria para filtrado colaborativo escalable

Mem-GF introduce un método de filtrado de grafos eficiente en memoria que aproxima los filtros de grafos polinómicos utilizando subespacios de Krylov, evitando el almacenamiento del grafo completo de similitud entre elementos. Logra hasta un 5.74× menos de uso de memoria y un tiempo de ejecución 4.38× más rápido, superando a los métodos de última generación en precisión y escalando a conjuntos de datos con decenas de millones de interacciones.

arxiv arXiv cs.AI · hace 3 h

FAST: Un marco para muestreo alineado y entrenamiento en aprendizaje por refuerzo paralelo

FAST aborda la ineficiencia del muestreo en el aprendizaje por refuerzo para conducción autónoma introduciendo Alineamiento de Muestreo Paralelo Dinámico para desacoplar los bucles de muestreo de las terminaciones individuales de episodios. Logra una aceleración de hasta 1.78 veces en tiempo real frente a líneas base de un solo clip, manteniendo la ausencia de sesgo estadístico mediante Optimización de Relleno de Máscara Escalada.

media Latent Space · hace 3 h

Explicación de los riesgos de Red Teaming de IA e Inyección de Prompts

Zico Kolter y Matt Fredrikson, coautores del artículo definitivo sobre inyecciones indirectas de prompts y autoridades en el modelo Mythos, discuten los crecientes riesgos de seguridad de la IA. Destacan que los sistemas de IA requieren una mentalidad de seguridad distinta, con agentes que introducen nuevas vulnerabilidades, y que el red-teaming especializado en IA puede superar a los humanos al romper modelos, haciendo que las brechas por inyección de prompts en la IA sean cada vez más probables.

media Import AI · hace 3 h

La IA supera a los humanos en persuasión: un nuevo estudio muestra que la IA es superior a los expertos

Un estudio de investigadores de Oxford, Stanford y LSE encuentra que los sistemas de IA superan consistentemente a los humanos expertos en cuatro experimentos que involucran 18.978 conversaciones. La IA superó a los canvisadores profesionales en 10.8 puntos porcentuales en donaciones reales a Save the Children, con Opus 4.1 y Opus 4.6 mostrando el mejor desempeño persuasivo.

media AI News (smol.ai) · hace 3 h

GLM-5.2 Destaca con un Avance y el Progreso de los Modelos Abiertos

El GLM-5.2 de Zhipu se consolidó como el modelo de peso abierto líder, elogiado por su rendimiento cercano a la vanguardia en el uso diario, con mejoras en tareas de codificación y reducción del costo de inferencia de 1M de tokens mediante IndexShare. Superó a otros modelos abiertos en benchmarks de trabajo de conocimiento agéntico, alcanzando 1266 Elo en la prueba AA-Briefcase de Artificial Analysis, aunque solo el 3% de las tareas fueron completamente satisfechas por los mejores modelos, lo que indica desafíos persistentes en el rendimiento de agentes a largo plazo en el mundo real.

media r/LocalLLaMA · hace 3 h

Propuesta de LLMs destilados de código abierto y crowdsourced mediante entrenamiento distribuido

Un usuario de Reddit propone un sistema para crear modelos de lenguaje grandes (LLMs) destilados verdaderamente de código abierto, envolviendo servicios de IA existentes por línea de comandos. Este enfoque recopilaría entradas y salidas de usuarios desde aplicaciones como asistentes de codificación o chatbots para construir conjuntos de datos masivos mediante la participación voluntaria.

media AI News (smol.ai) · hace 3 h

GLM-5.2 surge como modelo de código líder de pesos abiertos

GLM-5.2 es ampliamente considerado el primer modelo de código de pesos abiertos que rivaliza con modelos de vanguardia como Opus 4.8 y GPT-5.5 en capacidad. Los profesionales destacan su fuerte uso de herramientas, planificación a largo plazo y comportamiento autónomo de subagentes, con consenso de que ahora opera de manera creíble en el rango de SWE de vanguardia. La aparición del modelo subraya el creciente valor de los pesos abiertos para la competencia entre proveedores, despliegue on-prem y reducción del bloqueo de proveedor.

lab NVIDIA Technical Blog · hace 3 h

NVIDIA lanza XR AI para gafas de realidad aumentada y dispositivos portátiles

NVIDIA presenta XR AI para cerrar la brecha de infraestructura para desarrolladores que crean experiencias de IA en gafas de RA y dispositivos de RA. La solución permite la integración de flujos de sensores en vivo, modelos de IA multimodales y datos empresariales dentro de entornos de ejecución específicos del dispositivo, agilizando el desarrollo de agentes de IA para dispositivos portátiles.

arxiv arXiv cs.AI · hace 3 h

UFP4: El entrenamiento uniforme de 4 bits supera el sesgo de contracción en el preentrenamiento de LLM

Un estudio identifica un sesgo de contracción en los formatos FP4 basados en E2M1 debido a la asimetría geométrica, lo que provoca acumulación de errores multiplicativos e inestabilidad en el entrenamiento. La receta UFP4 propuesta utiliza cuadrículas uniformes E1M2/INT4 y aplica la Transformada de Hadamard Aleatoria a todos los GEMM, logrando una degradación menor de la pérdida que las líneas base E2M1 en el preentrenamiento de LLM a gran escala. Los autores recomiendan E1M2/INT4 como un primitivo de entrenamiento de primera clase para futuros aceleradores.