Все статьи — korshunov.ai

Все статьи Страница 1 / 118

Ainara: локальный ИИ-ассистент с постоянной памятью и переключением LLM

Ainara — это десктопное приложение, ориентированное на локальное выполнение, от разработчика из Дублина, которое функционирует как ИИ-компаньон с сохранением контекста между сессиями. Оно позволяет пользователям переключаться между облачными моделями, такими как Grok, Claude и Gemini, или локальными моделями Ollama, сохраняя контекст без разрывов.

media Hugging Face Forums · 7 ч назад

Практический опыт использования ML-суррогатов для CFD и FEA симуляций?

Инженер-симулятор ищет реальный опыт развертывания машинных суррогатов для снижения стоимости дорогостоящих запусков решателей вычислительной гидродинамики (CFD) и метода конечных элементов (FEA).

lab Meta AI / FAIR Blog · 7 ч назад

Brain2Qwerty v2 достигает 61% точности на уровне слов при неинвазивном декодировании текста из мозга

Исследователи выпустили Brain2Qwerty v2, неинвазивный AI-пайплайн, который декодирует предложения в реальном времени по данным магнитоэнцефалографии (MEG) без хирургических имплантатов. Система достигает общей точности на уровне слов 61% и до 78% у лучших участников, значительно превосходя предыдущие неинвазивные методы.

media AI News (smol.ai) · 8 ч назад

OpenAI расширяет Daybreak, Sakana выпускает Fugu, GLM-5.2 набирает популярность

В новостях ИИ этой недели выделяются расширение программ кибербезопасности OpenAI, выпуск системой оркестрации Fugu от Sakana AI и растущее распространение модели с открытыми весами GLM-5.2.

arxiv arXiv cs.LG · 8 ч назад

Использование сходств в многоручных бандитах

В данном исследовании рассматривается онлайн-обучение с множествами действий, структурированными по сходству и закодированными корневыми деревьями, показывая, что стандартная одноточечная обратная связь не может использовать эти сходства. Авторы предлагают унифицированные алгоритмы для более богатых моделей обратной связи, которые заменяют количество действий на эффективное число с учётом сходства для улучшения границ регрета.

arxiv arXiv cs.LG · 8 ч назад

GRINQH: Иерархия квантования на основе градации входных данных для эффективной генерации LLM

Исследователи предлагают GRINQH, фреймворк постобучающего квантования только весов, который ускоряет декодирование больших языковых моделей за счёт объединения квантования и разреженности. Метод динамически назначает каналы весов разным уровням точности на основе величин активаций, решая проблему ограниченности памяти на этапе декодирования.

media r/LocalLLaMA · 8 ч назад

Есть ли хорошие варианты использования сервера с 192 ГБ DDR3 в мире LLM?

Пользователь Reddit спрашивает о вариантах использования старого сервера IBM System X V4, оснащённого двумя процессорами Xeon E5-2640 и 192 ГБ ОЗУ DDR3 ECC для больших языковых моделей.

media r/LocalLLaMA · 8 ч назад

Как улучшить время отклика, кэшируя системный промпт?

Пользователь на r/LocalLLaMA спрашивает, как сократить примерно 10-секундное время обработки системного промпта длиной в 7.1k токенов для каждой новой сессии при использовании Ornith 35b с llama.cpp.

media r/LocalLLaMA · 8 ч назад

Возможно ли создание вредоносной LLM с бэкдором

Пользователь Reddit предлагает возможность обучения больших языковых моделей распознаванию конкретного секретного предложения, которое активирует вредоносное поведение, что вызывает опасения относительно рисков безопасности как для закрытых, так и для моделей с открытым исходным кодом.

media r/LocalLLaMA · 8 ч назад

Официальный запуск Deepseek V4 состоится в середине июля с изменениями цен на API

Пост в сообществе r/LocalLLaMA на Reddit обсуждает изображение, предполагающее, что официальный запуск Deepseek V4 состоится в середине июля и будет сопровождаться изменениями в структуре ценообразования API.

media r/LocalLLaMA · 8 ч назад

Пропуск блоков трансформера во время выполнения с помощью llama.cpp

Форк llama.cpp внедряет флаг --skip-layers, который позволяет пользователям пропускать целые блоки трансформера на этапе загрузки, предлагая альтернативу или дополнение к квантованию для размещения моделей в условиях ограниченного оборудования.

media r/LocalLLaMA · 8 ч назад

Лучший способ тестирования моделей с разными уровнями квантования перед покупкой GPU

Пользователь Reddit ищет советы о наиболее эффективном методе тестирования производительности моделей на различных уровнях квантования перед покупкой нового оборудования.

github llama.cpp · 8 ч назад

Выпуск llama.cpp b9840 добавляет поддержку DeepSeek V4 и мультиплатформенные бинарники

Выпуск llama.cpp b9840 вводит поддержку конвертации для модели DeepSeek V4, включая специальную обработку варианта Pro. Это обновление интегрирует новую архитектуру в библиотеку наряду с различными внутренними оптимизациями и исправлениями ошибок.

arxiv arXiv cs.LG · 9 ч назад

LoadKAN: Интерпретируемая сеть Колмогорова-Арнольда для прогнозирования нагрузки на электроэнергию

В данном исследовании представлена LoadKAN, новая гибридная архитектура, сочетающая механизм временного внимания с изоляцией признаков и сеть Колмогорова-Арнольда (KAN) для решения проблемы недостаточной интерпретируемости в прогнозировании нагрузки на электроэнергию на основе глубокого обучения.

arxiv arXiv cs.LG · 9 ч назад

STAITUS: Разделение внешнего вида и позы для отслеживания объектов на видео

В статье представлен STAITUS — унифицированная система для обучения без учителя при отслеживании объектов на видео, которая устраняет ограничения существующих слотовых представлений за счёт явного разделения внешнего вида и геометрической позы. Применяя временное выравнивание только в пространстве признаков (appearance space) и обеспечивая пространственное разделение внутри кадров, метод предотвращает «застревание» слотов на статичном фоне при движении.

arxiv arXiv cs.LG · 9 ч назад

Что знает химическая языковая модель о молекулах?

В данном исследовании применяются разреженные автоэнкодеры к MolFormer для механистического изучения того, как строятся представления молекул на разных слоях, что ставит под сомнение предположение о том, что химические языковые модели изучают только поверхностный синтаксис.

arxiv arXiv cs.LG · 9 ч назад

SkyJEPA: Обучение долгосрочных моделей мира для бесконтактного переноса из симуляции в реальность при управлении квадрокоптерами

В данной работе представлена SkyJEPA — модель в стиле JEPA, разработанная для управления квадрокоптерами в реальном времени и решающая проблемы усиления ошибок, присущие авторегрессионному долгосрочному прогнозированию. Подход объединяет модель латентной динамики с физически мотивированным пробером для отображения замороженных латентных переменных в интерпретируемые состояния, что обеспечивает предсказания, основанные на физических принципах.

arxiv arXiv cs.LG · 9 ч назад

Свёрнутые эффективные операторы для структур высшего порядка

Авторы представляют метод Свёрнутых эффективных операторов (Collapsed Effective Operators), который сжимает степени свободы высшего порядка в единый вершинный оператор с помощью дополнения Шура градуированного лапласиана. Этот подход даёт плотный оператор, кодирующий дальнодействующие взаимодействия, опосредованные топологией, и применим к произвольным конструкциям высшего порядка.

media r/LocalLLaMA · 9 ч назад

Официальная версия DeepSeek V4 будет выпущена в середине июля

Электронное письмо, отправленное от DeepSeek, указывает на то, что официальная версия DeepSeek V4 запланирована к выпуску в середине июля. Эта информация была распространена через переведенное изображение, изначально доступное только для пользователей из Китая.

media r/LocalLLaMA · 9 ч назад

Медленная работа Unsloth Gemma 12B Q8

Пользователь сообщает о значительном падении скорости инференса при переключении с GPT-OSS 20B Q4 на Gemma 4 12B Q8 с использованием llama.cpp, при этом пропускная способность упала примерно с 70 токенов в секунду до 10 токенов в секунду. Проблема сохраняется даже при тестировании варианта модели Q5 и отключении функции мышления, что дало лишь незначительный прирост в два дополнительных токена в секунду.