Все статьи — korshunov.ai

Все статьи Страница 1 / 130

llama.cpp Release b9699 Adds SYCL Support and Multiple Platform Binaries

llama.cpp version b9699 introduces support for MUL_MAT and OUT_PROD operations with Q1_0 precision via PR #24721. The release includes precompiled binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures and acceleration frameworks, including SYCL (FP32 and FP16), Vulkan, CUDA, ROCm, and OpenVINO.

media r/LocalLLaMA · 13 д назад

ML Models Recommended for M5 Max MacBook Pro with 128GB RAM

Пользователь просит рекомендации по моделям для своего MacBook Pro 16-дюймов с процессором M5 Max и 128 ГБ ОЗУ. Он использует модель Qwen 3.6 35B a3b через агента Hermes и LM Studio, отмечая пригодность моделей MLX для платформы Apple Silicon.

media r/LocalLLaMA · 13 д назад

Запуск Keye-VL-2.0-30B-A3B с продвинутыми возможностями понимания видео и функциями агента

Keye-VL-2.0-30B-A3B — это мультимодальный модель с 30 миллиардами параметров, разработанный для понимания длинных видео и функционирования агента. Она превосходит открытые конкурентов и достигает уровня Gemini-3-Flash в временной фиксации, поддерживает до 256K контекста с почти безпотерьным рассуждением и включает встроенные возможности для агентов по коду, инструментам и поиску в интернете.

github llama.cpp · 13 д назад

Релиз LLaMA.cpp b9697: Новые бинарники и обновления

LLaMA.cpp выпускает версию b9697 с обновлёнными бинарниками для macOS, Linux, Android, Windows и openEuler. В релизе включено поддержка ARM64, x64, Vulkan, CUDA 12 и 13, OpenVINO, SYCL и ROCm, а также исправлено баговое поведение при парсинге сообщений в проверках релиза.

media r/LocalLLaMA · 13 д назад

Дата быстрой версии GLM-5.2 (шутка)

Пользователь Reddit шутит о том, что Z.ai открыт исходный код GLM-5.2, выражая энтузиазм по поводу следующего поколения GLM-4.7-flash. В посте с юмором предлагается, что модель в диапазоне от 27 до 120 миллиардов параметров будет идеальной, хотя это представлено как шутка.

github AutoGPT · 13 д назад

Релиз autogpt-platform-beta-v0.6.64

Релиз autogpt-platform-beta-v0.6.64, датированной 18 июня 2026 года, вводит новые функции, такие как панель AutoPilot и глобальный поиск, а также улучшения в сохранении графов, кэшировании и производительности конструктора. В нём также содержатся меры по усилению безопасности, устранение ошибок в работе поставщиков LLM и улучшения интерфейса, включая высокоразрешающую иконку для сенсорного управления.

github CrewAI · 13 д назад

CrewAI v1.14.8a выпустил новые функции FlowDefinition

CrewAI v1.14.8a вводит скрипты и действия команды в FlowDefinition, добавляет поддержку режима DMN и позволяет выполнять потоки без кода на Python. Также включены экспериментальные возможности для команд на основе JSON и отказоустойчивое развертывание через ZIP, а также улучшена работа с памятью и отслеживание использования токенов.

media r/LocalLLaMA · 13 д назад

У кого есть достаточно вычислительных ресурсов, чтобы создать дистилляционный датасет из GLM5.2?

Пользователь спрашивает, у кого есть достаточные вычислительные ресурсы, чтобы создать большой дистилляционный датасет из 700 000 до 1 миллиона примеров из GLM5.2. Цель — улучшить обучение более маленьких моделей, таких как Qwen3.5, и помочь более широкой сообществу.

github llama.cpp · 13 д назад

llama.cpp Release b9693 Adds BF16 Support and Cross-Platform Binaries

llama.cpp version b9693 introduces BF16 support in its concat kernel and provides pre-built binaries for macOS, Linux, Android, Windows, and openEuler. The release includes CPU, Vulkan, ROCm, OpenVINO, SYCL, and HIP variants across multiple architectures, with a dedicated UI package available.

github llama.cpp · 13 д назад

llama.cpp выпустил версию b9694 с новыми бинарными файлами для нескольких платформ

llama.cpp выпустил версию b9694, включающую бинарные файлы для macOS, Linux, Android, Windows и openEuler. Релиз поддерживает различные архитектуры и опции ускорения, такие как CUDA, Vulkan, OpenVINO, SYCL и ROCm. Также была реализована исправление для связи Windows x64 OpenVINO.

media r/LocalLLaMA · 13 д назад

LocalLLaMA предлагает датасет для программирования, созданный сообществом

Инициатива сообщества предлагает создать датасет для программирования, собранный в ходе совместной работы, чтобы позволить разработке локальных моделей языковой обработки. Предложение направлено на то, чтобы позволить любому пользователю с оборудованием внести данные, при этом более мощные пользователи могут помогать в тонкой настройке или квантовании моделей, тем самым снижая зависимость от моделей, выпускаемых компаниями.

media r/LocalLLaMA · 13 д назад

Что вы недавно занимались?

Пользователь Reddit спрашивает обобществе о своих недавних проектах, отмечая, что хотя обсуждения сосредоточены на инструментах, мало информации о реальных приложениях или работе, проводимой с этими инструментами.

media r/LocalLLaMA · 13 д назад

Обзор GLM-5.2 и реакция на цензуру

GLM-5.2 демонстрирует исключительную согласованность в длинных контекстах и живое общение, превосходя Gemini-3.1-Pro по текстовым задачам и соответствующий GPT-5.5 по качеству логического мышления. Модель отвечает фактами на чувствительные темы, такие как Тайвань и площадь Тяньаньмен, предоставляя подробный исторический контекст без явной цензуры, хотя и следует китайским правительственным правилам содержания.

media Latent Space · 13 д назад

Midjourney представляет сканер ультразвуковой томографии тела

Midjourney объявил о запуске сканера ультразвуковой томографии тела, называя его первым новым методом медицинской визуализации тела за 50 лет. Прототип, известный как сканер Midjourney, использует 8960 трансдукторов в 40 системах, расположенных в кольце из 70 см, для сбора данных со скоростью 17 ГБ/с, с заявленной разрешающей способностью до 0,5 мм и целью достижения 358 000 элементов ультразвука. Система находится на 1-й версии, сцанирование занимает 20 минут, и на данный момент в генерации изображений не используется искусственный интеллект, хотя будущие версии планируют интегрировать ИИ и достичь 50 000 сканеров, обеспечивая ежемесячные 1 миллиард сканирований.

media r/LocalLLaMA · 13 д назад

Эффект роста цены является невероятным

Пост на Reddit обсуждает возможный релиз Q.01, отмечая, что точность больше не является приоритетом. В посте подчеркивается феномен, известный как "эффект роста цены", как значимый и неожиданный.

arxiv arXiv cs.LG · 14 д назад

Дискриминатор-ориентированный RL корректирует потоковое соответствие с помощью наград, синхронизированных с данными

Дискриминатор-ориентированный RL (DRL) использует предобученное пространство представлений для обучения дискриминатора, который отделяет реальные данные от образцов, сгенерированных моделью. Его логит используется в качестве награды в RL с регуляризацией КЛ, обеспечивая соответствие выводов модели визуальной и семантической реальности без человеческих предпочтений. DRL улучшает FID и семантическую FD во всех моделях, таких как SiT и JiT, и усиливает границу Парето между предпочтениями и точностью.

arxiv arXiv cs.LG · 14 д назад

Слияние основных подпространств для многозадачного обучения

Слияние основных подпространств (ESM) снижает перекрестное влияние между задачами, фокусируясь на главных направлениях сдвигов активации. ESM++ расширяет этот подход за счёт динамического выбора экспертов с помощью маршрутизации на основе прототипов, обеспечивая эффективное слияние многозадачных моделей без обучения.

arxiv arXiv cs.LG · 14 д назад

Безопасность отражения в предобучении для языковых моделей

Безопасность отражения в предобучении вставляет краткие отражения по безопасности в данные предобучения, чтобы обеспечить самонаблюдение в языковых моделях. Эксперименты с моделями 1,7B на наборе FineWeb-Edu показывают улучшенную точность по безопасности и снижение успешности атак, при этом MedSafetyWorld демонстрирует, что данный метод лучше предотвращает обобщение небезопасного поведения из безопасных данных, чем фильтрация данных или переписывание.

arxiv arXiv cs.LG · 14 д назад

Противоречия по размеру батчей в стохастических методах импульса

Методы стохастического импульса, такие как HB и ASGD, демонстрируют различные компромиссы по размеру батча в эффективности вычислений и последовательного времени выполнения. HB сохраняет вычислительную эффективность на уровне SGD в диапазоне размера батча, превышающем критический размер батча SGD на множитель \sqrt{\kappa}, в то время как ASGD улучшает эффективность малых батчей при быстром убывании спектра, но отдает эту эффективность при больших батчах в обмен на сокращение последовательного времени выполнения.

arxiv arXiv cs.LG · 14 д назад

AGDN: Решение задачи о продавце путешествий с анизотропным графовым диффузионным методом

AGDN представляет графическую нейронную сеть, которая решает проблемы топологических предпосылок и потери связности в задаче о продавце путешествий. Используя матрицу переходов MixScore и анизотропную диффузию, метод обеспечивает эффективный обмен информацией и превосходит существующие подходы по разнообразию размеров и распределений задач, при этом сохраняя конкурентную вычислительную скорость. Реализация доступна на GitHub.