Бенчмарк · agentic
BrowseComp
OpenAI's browser-use agent benchmark.
2 результатов
1 моделей
Qwen3-4B
Хронология
-
2026-06-18
Qwen3-4B
7.0pts
Данные рецептура повышает долгосрочное мышление в больших языковых моделях
-
2026-06-18
Qwen3-4B
7.0pts
Данные рецепт улучшает долгосрочное мышление в больших языковых моделях