Мультимодальная цепочка мыслей улучшает производительность в математических и научных рассуждениях, но ухудшает визуальное восприятие и подсчет объектов в задачах восприятия. Модели демонстрируют паттерн «Смотрим слабо, думаем сильно», при котором визуальное отражение снижается, а вербальное рассуждение увеличивается, что указывает на постоянный барьер в визуальной саморефлексии при мультимодальном рассуждении.
Мультимодальный цепочка мыслей: Возможности и ограничения
Переведено с English → Русский