Все статьи
media r/LocalLLaMA · 9 ч назад

Слепая оценка 55 LLM: Смещение в пользу моделей одного семейства статистически значимо

Открытая оценка, включавшая 55 моделей от 11 семейств разработчиков, показала, что большие языковые модели демонстрируют статистически значимое смещение в пользу своих же моделей при слепой оценке друг друга. Среди 22 254 действительных суждений каждое семейство, имевшее достаточный объем данных, проявляло тенденцию оценивать своих представителей иначе, чем модели других семейств.

media r/LocalLLaMA · 9 ч назад

Полное удаление конфиденциальных данных из документов с помощью Qwen 3.6 27B и агента на базе Pi

Автор демонстрирует, что локальные модели, в частности Qwen 3.6 27B, способны выполнять сквозное удаление конфиденциальных данных из документов при оптимизации с использованием более высокого уровня квантования и агентного интерфейса на основе фреймворка PI.

media r/LocalLLaMA · 9 ч назад

claude_converter: Преобразование сессий Claude Code в данные для тонкой настройки

Автор разработал `claude_converter`, инструмент, который преобразует локальные `.jsonl` файлы сессий Claude Code в форматы, совместимые с фреймворками для тонкой настройки, такими как TRL, Axolotl и LLaMA-Factory.

media r/LocalLLaMA · 9 ч назад

Станут ли китайские модели с открытым исходным кодом единственным вариантом в ближайшее время?

Пользователь Reddit утверждает, что американские технологические компании стремятся к полному глобальному контролю над ИИ и рассматривают выпуск продвинутых моделей как угрозу своему доминированию.

media r/LocalLLaMA · 9 ч назад

Model Registry: Торренты для открытых моделей с использованием Hugging Face в качестве резервного веб-сидa.

Создан новый репозиторий и сайт под названием Model Registry для публикации и распространения .torrent файлов популярных открытых моделей, используя Hugging Face в качестве резервного веб-сидa. Проект включает скрипты для автоматизации процесса и бэкенд-сервис, который перенаправляет BitTorrent-клиенты на правильный эндпоинт Hugging Face.

media r/LocalLLaMA · 10 ч назад

Домашняя лаборатория: 4 модифицированные RTX 4090 для локального вывода LLM

Пользователь описывает высокопроизводительную конфигурацию для локального вывода, использующую четыре модифицированных GPU NVIDIA RTX 4090 с 192 ГБ VRAM, в паре с материнской платой WRX90E-SAGE SE и блоком питания на 3000 Вт.

media r/LocalLLaMA · 10 ч назад

Могли бы ИИ-апскейлеры для игр получить выгоду от легких игровых адаптеров?

Пользователь Reddit предлагает, чтобы технологии ИИ-масштабирования, такие как DLSS и FSR, могли использовать легкие специфичные для игры адаптерные слои для улучшения производительности на маломощном оборудовании.

media r/LocalLLaMA · 10 ч назад

Влияние квантования на скорость принятия черновиков MTP

Анализ спекулятивного декодирования с использованием моделей Gemma 4-31B-it показывает, что сильное квантование снижает частоту принятия токенов, поскольку основная модель становится менее согласованной с генератором черновиков. Тестирование квантований Q5_K_S, IQ4_XS, IQ3_M и IQ2_M выявляет, как глубина черновика влияет на производительность.

media r/LocalLLaMA · 10 ч назад

Запуск GLM5.2 на бюджетном оборудовании < $2500

Пользователь Reddit демонстрирует, как собрать локальную систему для вывода ИИ менее чем за $2500, используя доступные б/у компоненты, с акцентом на возможность запуска больших языковых моделей, таких как GLM-5.2, без дорогого корпоративного оборудования.

media r/LocalLLaMA · 10 ч назад

Пользователи сообщают, что Ornith 35B превосходит Qwen в генерации 3D-игр

Пользователь Reddit делится опытом использования Claude Code для создания 3D-игры с моделью Ornith 35B. После трех промптов модель успешно выдала запрошенный результат, тогда как модель Qwen3.5-35b-a3b не смогла этого сделать даже после нескольких попыток.

media r/LocalLLaMA · 10 ч назад

Наблюдения за спадом обсуждений дообучения на потребительском оборудовании

Пользователь Reddit отмечает, что интерес к дообучению моделей на оборудовании потребительского класса, похоже, снизился после выпуска способных универсальных моделей, таких как Llama-3-8b. Автор предполагает, что повышение интеллекта базовой модели снижает необходимость в дообучении, поскольку часто достаточно промпт-инжиниринга.

media r/LocalLLaMA · 10 ч назад

Google проводит хакатоны для малых моделей, таких как Gemma 4 31B

Google организует хакатоны, ориентированные на малые языковые модели, в частности Gemma 4 31B, чтобы продемонстрировать их ценность в инженерии программного обеспечения с помощью ИИ. Эта инициатива подчеркивает убежденность компании в полезности малых моделей, несмотря на отраслевой тренд в сторону более крупных.

media r/LocalLLaMA · 11 ч назад

ObviousBench: бенчмарк для выявления очевидных сбоев LLM в более мелких моделях

ObviousBench — это новый бенчмарк, предназначенный для оценки видимых сбоев в больших языковых моделях, с акцентом на то, как выбор конфигурации влияет на уровень ошибок. Инструмент подчеркивает компромиссы между размером модели, скоростью и способностями к рассуждению, а не просто ранжирует производительность.

media r/LocalLLaMA · 11 ч назад

Интервью Кори Доктороу об ИИ и продвижении локального ИИ

Этот пост на Reddit содержит интервью Ars Technica с Кори Доктороу о его взглядах на искусственный интеллект. Автор поста подчеркивает критический тон статьи в отношении крупных технологических компаний, пытающихся выйти на IPO.

media r/LocalLLaMA · 11 ч назад

SupraLabs выпустила SupraSafety-18M, крошечную модель для модерации контента

SupraLabs выпустила SupraSafety-18M, бинарный классификатор текста в стиле BERT с 18 миллионами параметров, предназначенный для модерации контента на периферийных устройствах и мобильных телефонах. Модель обучена с нуля на наборе данных nvidia/Nemotron-3.5-Content-Safety-Dataset и достигает точности (accuracy) 81,2% и прецизионности (precision) 86,9%.

media r/LocalLLaMA · 11 ч назад

Оператор GPU-лаборатории предупреждает о мошенничестве с предзаказами на 96 ГБ RTX 4090 и 5090

Оператор GPU-лаборатории в США, сотрудничающий с китайскими фабриками по производству модифицированных печатных плат RTX 4090 на 48 ГБ, предупреждает, что объявления о продаже RTX 4090 и RTX 5090 на 96 ГБ являются мошенничеством по состоянию на июнь 2026 года.