Benchmark results — korshunov.ai

Benchmark results Страница 2 / 2

VibeThinker-3B: Что за колдовство?

VibeThinker-3B — это маленький модель с 3 миллиардами параметров, которая показывает исключительные результаты на тесте MathQA, достигая результатов, сопоставимых с моделями, имеющими около 30 миллиардов параметров. Сильная производительность модели вызвала обсуждение её эффективности и возможностей в математическом мышлении.

media r/LocalLLaMA · 8 д назад

Minimax M3 (4-bit MLX) первоначальный бенчмарк на Mac Studio M3 с 512 ГБ

Minimax M3 (4-bit MLX) был протестирован на Mac Studio M3 с хранилищем на 512 ГБ. Результаты показывают показатели пропускной способности и задержки при различных размерах запросов, при пиковой производительности 269,1 ток/с для запросов размером 8192 токен и 172,8 ток/с для запроса размером 65 к токен, используя пиковое значение памяти 228 ГБ.

media r/LocalLLaMA · 8 д назад

GLM-5.2 теперь первый на Design Arena

GLM-5.2 был оценен на первом месте на Design Arena, превзойдя ранее доступный Claude Fable 5. Модель Claude Fable 5 теперь недоступна, что способствовало первому месту у GLM-5.2.

media r/LocalLLaMA · 8 д назад

Живой API GLM 5.2, веса на Hugging Face, поддержка Ollama

Живой API GLM 5.2 теперь доступен, веса модели доступны на Hugging Face по лицензии MIT и поддерживаются Ollama. Модель предлагает два режима мышления — Высокий и Максимум — с длиной контекста 1 млн токенов, цена составляет 1,4 доллара за 1 млн входных токенов и 4,4 доллара за 1 млн выходных токенов, что соответствует GLM-5.1.

media r/LocalLLaMA · 8 д назад

GLM-5.2 превышает 80% на Terminal-Bench

GLM-5.2 — первый открытый модель с весами, достигший точности 80% на Terminal-Bench и превосходящий все другие доступные открытые модели. Он также превосходит Gemini, что делает его моделью передовой категории при значительно более низкой стоимости.

media r/LocalLLaMA · 8 д назад

GLM-5.2 занимает второе место в WebDew Arena

GLM-5.2 занял второе место в оценке WebDew Arena. Результат отражает его высокую производительность в задачах понимания и генерации естественного языка по сравнению с другими моделями.