Бенчмарк · agentic

BrowseComp

OpenAI's browser-use agent benchmark.

2 результатов 1 моделей

Qwen3-4B

Хронология

2026-06-18 Qwen3-4B 7.0pts Данные рецептура повышает долгосрочное мышление в больших языковых моделях
2026-06-18 Qwen3-4B 7.0pts Данные рецепт улучшает долгосрочное мышление в больших языковых моделях