Todos los artículos
arxiv arXiv cs.LG · hace 2 h

Modelo de Acción Geométrica para el Aprendizaje de Políticas Robóticas

El Modelo de Acción Geométrica (GAM) permite que las políticas robóticas razonen sobre interacciones físicas en 3D mediante la reutilización de un modelo base geométrico preentrenado. GAM divide el GFM para servir como codificador de observaciones y predictor causal del futuro, luego enruta la geometría futura y las acciones predichas a través del mismo backbone, logrando un rendimiento preciso, robusto y eficiente en manipulación en simulación y benchmarks con robots reales.

arxiv arXiv cs.LG · hace 2 h

Estimación exacta del puntaje posterior para problemas inversos lineales

El artículo deriva el puntaje posterior exacto en forma cerrada para problemas inversos gaussianos lineales, permitiendo un muestreo posterior eficiente mediante desruido. Introduce Exact Posterior Score (EPS), un objetivo de entrenamiento que preserva la estructura del preentrenamiento y logra un rendimiento superior en métricas de fidelidad, perceptual y distribucional con menos evaluaciones del desruidor que los métodos basados en gradientes.

media r/LocalLLaMA · hace 3 h

Evaluación ciega de 55 LLM: El sesgo de calificación intra-familia es estadísticamente significativo

Una evaluación abierta que involucró a 55 modelos de 11 familias de desarrolladores reveló que los grandes modelos de lenguaje exhiben un sesgo de grupo estadísticamente significativo al calificarse mutuamente en ciego. A lo largo de 22,254 juicios válidos, cada familia con datos suficientes mostró una tendencia a calificar a sus propios miembros de manera diferente a la de otras familias.