media r/LocalLLaMA · 6 д назад · open_models

GLM-5.2 превосходит GPT-5.5 в оценке AA-Briefcase

Переведено с English → Русский

Новая оценка агентных задач искусственного анализа, AA-Briefcase, показывает, что GLM-5.2 превосходит GPT-5.5 по производительности. Оценка оценивает выполнение реальных задач и способность к логическому мышлению в сценариях работы с знаниями.

Важность 3/3 Обходит бенчмарк топ-лаборатории r/LocalLLaMA Zhipu AI OpenAI AI agents Benchmark results Evaluation & benchmarks

Оригинал