Все статьи
arxiv arXiv cs.LG · 9 ч назад

Оценка транспортных потоков без моделирования на основе разреженных данных подсчёта

Авторы предлагают метод оценки изменяющихся во времени паттернов транспортных потоков по разреженным агрегированным данным подсчёта транспортных средств путём разделения изучаемой области и решения задачи оптимизации взвешенного метода наименьших квадратов. Этот подход использует матрицу взвешенного вклада для кодирования покрытия датчиками, направляя оптимизатор к конфигурациям потоков, которые непосредственно наблюдаемы.

arxiv arXiv cs.LG · 9 ч назад

SQLConductor: Обучение от поиска к политике для пошаговой оркестровки Text-to-SQL

В статье представлен SQLConductor, фреймворк обучения пошаговой оркестровке для Text-to-SQL, который формулирует подзадачи как специализированные действия и обучает модель политики выбирать следующее действие на основе промежуточных артефактов и обратной связи.

arxiv arXiv cs.LG · 9 ч назад

VeriEvol: Масштабирование мультимодального математического рассуждения через верифицируемое эволюционное обучение

VeriEvol — это итеративная система, предназначенная для масштабирования мультимодального математического рассуждения путем разделения сложности промпта и надежности ответа на этапе конструирования данных. Она использует модуль эволюции с учетом типа для генерации более сложных промптов и верификатор HTV-Agent для обеспечения правильности ответов посредством поиска контрдоказательств из нескольких источников.

arxiv arXiv cs.LG · 9 ч назад

Потребление энергии при тонкой настройке трансформеров: модель масштабирования, вдохновленная roofline

В данной статье представлена框架 для моделирования энергопотребления обучения трансформеров на нескольких GPU, направленная на решение растущих вычислительных затрат в контексте устойчивого проектирования систем.

arxiv arXiv cs.LG · 9 ч назад

SuperCond-GNN: Масштабируемая суррогатная модель графовых нейронных сетей для симуляций сверхпроводящих цепей

В данной статье представлена SuperCond-GNN, суррогатная модель на основе графовых нейронных сетей, предназначенная для прогнозирования распределения напряжения в высокотемпературных сверхпроводящих магнитах путем отображения эквивалентных схем с сосредоточенными параметрами на графовые представления. Модель достигает среднего MAPE 4.3% на ленточных стопках и обеспечивает быстрое вычисление перераспределения тока в различных конфигурациях цепей.

arxiv arXiv cs.LG · 9 ч назад

Аппроксимация полей скоростей с помощью внедренных аттракторов через Neural-ODEs для классификации

В данной работе используются нейронные ОДУ, оснащенные тщательно подобранным набором точек равновесия, для выполнения задач классификации. Внедренные аттракторы служат индикаторами целевых классов, а поле скоростей формирует динамический ландшафт, направляя входные данные к их соответствующим пунктам назначения.

arxiv arXiv cs.LG · 9 ч назад

Мысли о планировании: обучение порядку рассуждений в диффузионных языковых моделях

Исследователи предлагают метод Self-Aware Scheduling (SAS), который обучает оптимальный порядок раскрытия токенов для маскированных диффузионных языковых моделей с целью улучшения качества генерации. Выводя достижимую верхнюю границу несоответствия последовательного декодирования, подход формулирует выбор порядка как задачу оптимизации политики с использованием Group Relative Policy Optimization.

media r/LocalLLaMA · 9 ч назад

Высококачественная квантование GLM-5.2 на 4x DGX Spark: руководство, результаты и сравнения

Автор демонстрирует запуск модели GLM-5.2 NVFP4 на четырех узлах NVIDIA GB10 DGX Spark с контекстным окном 128K, достигая пригодной для использования производительности обслуживания благодаря агрессивной оптимизации системы.

media r/LocalLLaMA · 9 ч назад

Пример руководства по тонкой настройке MLX

Пользователь демонстрирует тонкую настройку 7B-модели для инструкций на Apple Silicon с использованием MLX для изменения стиля на высокофэнтезийную литературу. Эксперимент показывает, что небольшой, тщательно подобранный набор данных может значительно изменить регистр и лексику модели при минимальных вычислительных ресурсах.

arxiv arXiv cs.LG · 10 ч назад

SVD-Surgeon: Оптимальная хирургия сингулярных значений для сжатия больших языковых моделей

Исследователи представили SVD-Surgeon, метод без дообучения, который применяет фреймворк Optimal Brain Surgeon к сингулярному разложению для сжатия больших языковых моделей. Этот подход вычисляет обновления в замкнутой форме для сохраняемых сингулярных значений, чтобы компенсировать ошибки усечения, и определяет, какие значения следует отбросить, на основе их значимости.

arxiv arXiv cs.LG · 10 ч назад

Контрастное обучение с учётом пациента сохраняет внутрипациентскую структуру в представлениях RR-интервалов

Статья рассматривает проблему контрастного обучения представлений на физиологических сигналах, где индивидуальные базовые уровни субъектов мешают целям на уровне классов, что приводит к потере моделями индивидуальных вариаций, необходимых для обобщения. Авторы предлагают контрастную функцию потерь с учётом пациента для обнаружения пароксизмальной фибрилляции предсердий, которая формирует положительные пары только из сегментов одного и того же пациента, чтобы сохранить базовые уровни синусового ритма при одновременном разделении классов.

arxiv arXiv cs.LG · 10 ч назад

Спектральная теория нормализованного скорректированного распространения GNN

В данной работе разрабатывается спектральная теория для нормализованного скорректированного распространения графовых нейронных сетей (GNN), с акцентом на симметричную нормализованную матрицу смежности, из которой удален ее компонент, стационарный по степени, чтобы изолировать направление, связанное с чрезмерным сглаживанием.

arxiv arXiv cs.LG · 10 ч назад

MORL-A2C: Ранжерер для многокритериального обучения с подкреплением для здоровья

Исследователи представляют MORL-A2C, расширение последовательного принятия решений для системы MOPI-HFRS, которое использует алгоритм Advantage Actor-Critic для оптимизации компромисса между предпочтениями пользователя и нутритивным здоровьем в рекомендациях по питанию.

media r/LocalLLaMA · 10 ч назад

Я создал агентный каркас для малых моделей. Qwen 3.5 4b управляет серверами.

Автор разработал специализированный агентный каркас, предназначенный для устранения специфических сбоев малых локальных моделей, таких как неудачные вызовы инструментов и плохой трекинг состояния. Этот пользовательский фреймворк позволяет меньшим моделям, таким как Qwen 3.5 4b, эффективно управлять удаленными серверами.

media r/LocalLLaMA · 10 ч назад

Локальный режим превращает изображение в милого управляемого персонажа, за которого можно играть

Автор представляет версию модели на 800M параметров, которая преобразует изображения в управляемых персонажей, предназначенную для комфортной работы на потребительских GPU. Эта итерация увеличивает контекст до 12 латентных кадров и повышает стабильность при сохранении высокой производительности, достигая более 60 кадров в секунду на RTX 5090.

media Hugging Face Forums · 10 ч назад

HoLo-ToLk: модели речи без токенизатора на основе нулевого параметра HSL

Автор представляет HoLo-ToLk, исследовательский проект по созданию моделей преобразования речи в текст (STT) и текста в речь (TTS) с использованием нулевого параметра HSL byte substrate без токенизаторов или обучаемых входных эмбеддингов. Работа демонстрирует, что сырые байты HSL могут служить жизнеспособным сигналом для обработки аудио при сочетании с определенными архитектурными модификациями.

github llama.cpp · 10 ч назад

Выпуск llama.cpp b9837 добавляет флаг --reasoning-preserve и новые бинарные файлы

Проект llama.cpp выпустил версию b9837, которая вводит новый флаг `--reasoning-preserve` для шаблона чата Jinja, чтобы сохранять токены рассуждения. Это обновление также включает исправленные сообщения справки и предоставляет предварительно собранные бинарные файлы для macOS, Linux, Windows, Android и openEuler для различных аппаратных бэкендов.

lab OpenAI News · 10 ч назад

HP Inc. запускает стратегическое партнерство Frontier с OpenAI

HP Inc. расширяет свое стратегическое партнерство с OpenAI после успешных пилотных проектов, внедряя ИИ в клиентский опыт, продуктивность сотрудников и разработку программного обеспечения. Компания использует платформу OpenAI Frontier в качестве единой операционной модели для управления контекстом, разрешениями и оценкой по мере перехода от экспериментальных кейсов к производству на уровне всей компании.

arxiv arXiv cs.LG · 11 ч назад

Решение для гиперпараметра, пропуск поиска: законы масштабирования Колмогорова-Оптимальные для сплайновой регрессии

Статья представляет KORE, метод, который определяет оптимальное разрешение сплайновой регрессии в замкнутой форме, а не через исчерпывающий поиск гиперпараметров. Используя классическую теорию аппроксимации и тождество PRESS, он аналитически балансирует масштабы смещения и шума для достижения точности, сопоставимой с перебором по сетке, но при значительно меньших вычислительных затратах.