Primera Prueba Segunda Lote: IA Evaluada en Problemas de Matemáticas de Nivel de Investigación
Un estudio evaluó varios sistemas de IA en diez problemas de matemáticas de nivel de investigación creados por matemáticos prominentes. Los resultados incluyen soluciones generadas por IA, soluciones humanas e informes de árbitros, ofreciendo una evaluación detallada del rendimiento de la IA en la resolución de problemas matemáticos avanzados.