Все статьи — korshunov.ai

Все статьи Страница 1 / 107

Слепой визуальный парадигм для проверки переноса навыков в малых моделях без дообучения

Автор предлагает кросс-доменный слепой визуальный эксперимент, чтобы определить, может ли большая языковая модель сжать свое процедурное планирование в переиспользуемый каркас, который улучшает вывод малой модели без дообучения. Используя Three.js в качестве тестовой среды, исследование направлено на доказательство того, что этот перенос навыков является подлинным, а не просто переобучением на исходном домене.

media r/LocalLLaMA · 6 ч назад

Пользователь собирает локальную установку для LLM на максимуме с RTX Pro 5000 и Ryzen 9950X3D

Пользователь Reddit делится завершением высококлассной локальной рабочей станции для ИИ, оснащённой GPU NVIDIA RTX Pro 5000, CPU AMD Ryzen 9 9950X3D, 192 ГБ ОЗУ и 80 ГБ видеопамяти. Сборка была завершена после того, как заявка пользователя на участие в программе NVIDIA Inception была отклонена, а цены на RTX Pro 6000 превысили его бюджет.

media r/LocalLLaMA · 6 ч назад

Проверено, какая модель лучше всего отправляет HTML-письма

Недавно пользователь развернул инструмент Mailcue, включающий MCP-сервер для управления электронной почтой, и протестировал три конкретные модели, чтобы определить, какая из них генерирует наиболее визуально привлекательные HTML-письма. Оценивались следующие модели: google/gemma-4-26b-a4b-qat, qwen/qwen3.6-35b-a3b и qwen/qwen3.6-27b.

Слепой визуальный парадигм для проверки переноса навыков в малых моделях без дообучения

Пользователь собирает локальную установку для LLM на максимуме с RTX Pro 5000 и Ryzen 9950X3D

Проверено, какая модель лучше всего отправляет HTML-письма

Пост в Reddit: 10x Каиокен SSJ1 4-й класс, стоит ли того в 2026? Сможет ли он запустить Qwen3.6?

Обновление бенчмарка US Ban: GPT-5.6 сравнялся с Anthropic

Вышла Koboldcpp v1.116

Слепая оценка 55 LLM: Смещение в пользу моделей одного семейства статистически значимо

Пользователь спрашивает, стоит ли брать 2x RX 9060xt 16GB для запуска Qwen 3.6 27B

Полное удаление конфиденциальных данных из документов с помощью Qwen 3.6 27B и агента на базе Pi

claude_converter: Преобразование сессий Claude Code в данные для тонкой настройки

Станут ли китайские модели с открытым исходным кодом единственным вариантом в ближайшее время?

Model Registry: Торренты для открытых моделей с использованием Hugging Face в качестве резервного веб-сидa.

Домашняя лаборатория: 4 модифицированные RTX 4090 для локального вывода LLM

Могли бы ИИ-апскейлеры для игр получить выгоду от легких игровых адаптеров?

Самая большая модель для дистилляции при VRAM до 64 ГБ

Влияние квантования на скорость принятия черновиков MTP

Запуск GLM5.2 на бюджетном оборудовании < $2500

Пользователи сообщают, что Ornith 35B превосходит Qwen в генерации 3D-игр

Наблюдения за спадом обсуждений дообучения на потребительском оборудовании

Google проводит хакатоны для малых моделей, таких как Gemma 4 31B