Все статьи
media r/LocalLLaMA · 13 д назад

ОПЕН-СОУС-модели decisively overtook proprietary models in market share

На основании данных OpenRouter за последние три месяца, открытые модели превзошли проприетарные модели по доле рынка. Анализ показывает значительный сдвиг в сторону открытых языковых моделей в общей экосистеме ИИ.

media r/LocalLLaMA · 13 д назад

Llama Bench vs Реальное отклонение производительности

Пользователь сообщает о значительной разнице между результатами Llama benchmark и реальной производительностью модели. Бенчмарки показывают 754 токен/с при предварительной загрузке и 36 токен/с при генерации, однако в реальных условиях наблюдается только 7,98 токена в секунду, с высокой задержкой и плохим пропускным расходом. Отклонение объясняется реальными условиями использования, а не настройками бенчмарка, что указывает на то, что реальная производительность модели значительно ниже скорости, указанной в бенчмарке.

media r/LocalLLaMA · 13 д назад

Локальный агент LLM теперь генерирует изображения и видео в автономном режиме

Пользователь поделился тем, что их локальный агент LLM оснащен инструментами MCP для прямого генерирования изображений и видео. Система работает полностью автономно и является бесплатной для использования, подробности и исходный код доступны в комментариях.

github llama.cpp · 13 д назад

llama.cpp release b9700: new binaries and SYCL API updates

llama.cpp version b9700 вводит обновленную поддержку SYCL с переименованными флагами API: GGML_SYCL_SUPPORT_LEVEL_ZERO переименован в GGML_SYCL_SUPPORT_LEVEL_ZERO_API и GGML_SYCL_ENABLE_LEVEL_ZERO переименован в GGML_SYCL_USE_LEVEL_ZERO_API. В релизе представлены бинарные файлы для macOS, Linux, Android, Windows и openEuler на нескольких архитектурах и вариантах ускорения, включая Vulkan, ROCm, OpenVINO и SYCL.

github llama.cpp · 13 д назад

LLaMA.cpp Release b9698 Добавляет поддержку самоподписки и бинарники для нескольких платформ

Версия LLaMA.cpp b9698 позволяет включать самоподписку только при сборке с помощью llama-install.sh. В этом выпуске представлены бинарники для macOS, Linux, Android, Windows и openEuler на разных архитектурах и вариантах ускорения, включая Vulkan, CUDA, OpenVINO и SYCL.

media r/LocalLLaMA · 13 д назад

Запуск Keye-VL-2.0-30B-A3B с продвинутыми возможностями понимания видео и функциями агента

Keye-VL-2.0-30B-A3B — это мультимодальный модель с 30 миллиардами параметров, разработанный для понимания длинных видео и функционирования агента. Она превосходит открытые конкурентов и достигает уровня Gemini-3-Flash в временной фиксации, поддерживает до 256K контекста с почти безпотерьным рассуждением и включает встроенные возможности для агентов по коду, инструментам и поиску в интернете.

github llama.cpp · 13 д назад

Релиз LLaMA.cpp b9697: Новые бинарники и обновления

LLaMA.cpp выпускает версию b9697 с обновлёнными бинарниками для macOS, Linux, Android, Windows и openEuler. В релизе включено поддержка ARM64, x64, Vulkan, CUDA 12 и 13, OpenVINO, SYCL и ROCm, а также исправлено баговое поведение при парсинге сообщений в проверках релиза.

media r/LocalLLaMA · 13 д назад

Дата быстрой версии GLM-5.2 (шутка)

Пользователь Reddit шутит о том, что Z.ai открыт исходный код GLM-5.2, выражая энтузиазм по поводу следующего поколения GLM-4.7-flash. В посте с юмором предлагается, что модель в диапазоне от 27 до 120 миллиардов параметров будет идеальной, хотя это представлено как шутка.

github AutoGPT · 13 д назад

Релиз autogpt-platform-beta-v0.6.64

Релиз autogpt-platform-beta-v0.6.64, датированной 18 июня 2026 года, вводит новые функции, такие как панель AutoPilot и глобальный поиск, а также улучшения в сохранении графов, кэшировании и производительности конструктора. В нём также содержатся меры по усилению безопасности, устранение ошибок в работе поставщиков LLM и улучшения интерфейса, включая высокоразрешающую иконку для сенсорного управления.

github CrewAI · 13 д назад

CrewAI v1.14.8a выпустил новые функции FlowDefinition

CrewAI v1.14.8a вводит скрипты и действия команды в FlowDefinition, добавляет поддержку режима DMN и позволяет выполнять потоки без кода на Python. Также включены экспериментальные возможности для команд на основе JSON и отказоустойчивое развертывание через ZIP, а также улучшена работа с памятью и отслеживание использования токенов.

media r/LocalLLaMA · 13 д назад

У кого есть достаточно вычислительных ресурсов, чтобы создать дистилляционный датасет из GLM5.2?

Пользователь спрашивает, у кого есть достаточные вычислительные ресурсы, чтобы создать большой дистилляционный датасет из 700 000 до 1 миллиона примеров из GLM5.2. Цель — улучшить обучение более маленьких моделей, таких как Qwen3.5, и помочь более широкой сообществу.

github llama.cpp · 13 д назад

llama.cpp выпустил версию b9694 с новыми бинарными файлами для нескольких платформ

llama.cpp выпустил версию b9694, включающую бинарные файлы для macOS, Linux, Android, Windows и openEuler. Релиз поддерживает различные архитектуры и опции ускорения, такие как CUDA, Vulkan, OpenVINO, SYCL и ROCm. Также была реализована исправление для связи Windows x64 OpenVINO.

media r/LocalLLaMA · 13 д назад

LocalLLaMA предлагает датасет для программирования, созданный сообществом

Инициатива сообщества предлагает создать датасет для программирования, собранный в ходе совместной работы, чтобы позволить разработке локальных моделей языковой обработки. Предложение направлено на то, чтобы позволить любому пользователю с оборудованием внести данные, при этом более мощные пользователи могут помогать в тонкой настройке или квантовании моделей, тем самым снижая зависимость от моделей, выпускаемых компаниями.

media r/LocalLLaMA · 13 д назад

Обзор GLM-5.2 и реакция на цензуру

GLM-5.2 демонстрирует исключительную согласованность в длинных контекстах и живое общение, превосходя Gemini-3.1-Pro по текстовым задачам и соответствующий GPT-5.5 по качеству логического мышления. Модель отвечает фактами на чувствительные темы, такие как Тайвань и площадь Тяньаньмен, предоставляя подробный исторический контекст без явной цензуры, хотя и следует китайским правительственным правилам содержания.

media Latent Space · 13 д назад

Midjourney представляет сканер ультразвуковой томографии тела

Midjourney объявил о запуске сканера ультразвуковой томографии тела, называя его первым новым методом медицинской визуализации тела за 50 лет. Прототип, известный как сканер Midjourney, использует 8960 трансдукторов в 40 системах, расположенных в кольце из 70 см, для сбора данных со скоростью 17 ГБ/с, с заявленной разрешающей способностью до 0,5 мм и целью достижения 358 000 элементов ультразвука. Система находится на 1-й версии, сцанирование занимает 20 минут, и на данный момент в генерации изображений не используется искусственный интеллект, хотя будущие версии планируют интегрировать ИИ и достичь 50 000 сканеров, обеспечивая ежемесячные 1 миллиард сканирований.