Reasoning models — korshunov.ai

Reasoning models Страница 14 / 35

Самоадаптивная обработка масштабов для прогнозирования временных рядов

Новый модуль, называемый Самоадаптивной обработкой масштабов (AS), решает проблему гетерогенности масштабов в прогнозировании временных рядов. Он использует Калибровку масштабов и Выбор масштабирования для адаптивного регулирования коэффициентов масштабирования, сохраняя семантическую дискриминацию и снижая ошибки обратного масштабирования. Эксперименты на данных о продажах фондов показывают улучшенную производительность при интеграции в существующие прогнозирующие модели.

arxiv arXiv cs.LG · 7 д назад

Контроль на основе LLM в многоконтролируемых играх

Характеристика иерархической системы, использующей предобученный LLM для выбора политик RL-навыков, превосходит плоскую RL в среде 2v2 King of the Hill. Она соответствует показателю эффективности, достигнутому при ручной разработке дерева поведения, и воспринимается как более человеческая на 60% пользователей, что подчеркивает эффективную координацию и адаптивность без ручного проектирования правил.

arxiv arXiv cs.LG · 7 д назад

AD-DeepONet для быстрого прогнозирования ответа моста

Адаптивная структура DeepONet позволяет с высокой точностью предсказывать локальные структурные реакции в мостах с большими пролетами. Используя расстояние-ориентированные признаки и схему Шура, основанную на жесткости, достигается точность, сравнимая с методом конечных элементов, с ошибкой менее 5%, что позволяет сократить общее время оценки реакции на 60 раз и скорость инференса на порядок до четырех десятков по сравнению с методом конечных элементов.

arxiv arXiv cs.LG · 7 д назад

PU-UNet: Стабильные мультипликативные взаимодействия для сегментации медицинских изображений

PU-UNet вводит стабильные продукт-единичные резидуальные блоки в U-Net для сегментации медицинских изображений, позволяя явным мультипликативным взаимодействиям признаков без числовых нестабильностей. Оно достигает высоких значений Dice на ISIC 2018, Kvasir-SEG и BUSI, превосходит базовую модель Residual U-Net по Dice и IoU, и устраняет ложноположительные значения на нормальных случаях BUSI.

arxiv arXiv cs.LG · 7 д назад

Диагностика альцгеймера с использованием слияния мультимодальных 3D МРТ и ПЭТ

Новое исследование объединяет данные 3D МРТ и ПЭТ с помощью продвинутых стратегий слияния, включая GMU и гатед самовнимание, а также спарсно гатед MoE классификатор. Результаты показывают, что GMU достигает точности 80,46% на NC против MCI и 95,47% на NC против AD, при гатед самовнимании достигается 82,08% на MCI против AD. Исследования с устранением компонент подтверждают, что MoE значительно улучшает производительность, подчеркивая важность мультимодального моделирования с адаптацией к входным данным для точной диагностики альцгеймера.

arxiv arXiv cs.LG · 7 д назад

AI Экономист-агент: Фреймворк анализа на основе моделей

AI Экономист-агент использует RAG, графы знаний и ЛЛМ для генерации экономических нарративов, основанных на теории и данных. Он обеспечивает анализ на основе моделей, извлечение доказательств и генерацию отчетов, гарантируя экономическую целостность и отслеживаемость за счет явных вычислений моделей.

arxiv arXiv cs.LG · 7 д назад

Сравнительное исследование нейронных заменителей для прогноза состояния аккумулятора

Сравнительное исследование оценивает четыре нейронные архитектуры — MLP, ResNet, U-Net и FNO — как автокорреляционные предикторы внутренних состояний аккумулятора с использованием модели Doyle-Fuller-Newman. U-Net достигает среднего значения nRMSE на последнем шаге в 3% по всем переменным состояния и обеспечивает ускорение в 5,38 раз по сравнению с численными решателями, что демонстрирует важность пространственной индуктивной предпосылки в производительности заменителей.

arxiv arXiv cs.LG · 7 д назад

PaAno+: Легкая модель обнаружения аномалий в временных рядах с мультискалярным и межпеременной вниманием

PaAno+ представляет легкую модель, использующую мультискалярное конволюционирование и межпеременную внимательность для улучшения обнаружения аномалий в временных рядах. Она достигает наилучших результатов по точности как на одномерных, так и на многомерных задачах, демонстрируя превосходные показатели по VUS-PR и другим метрикам, при этом обеспечивая эффективное вычисление для реального времени на устройствах с ограниченными ресурсами.

arxiv arXiv cs.LG · 7 д назад

Оптимальные коардинационные коррелированные равновесия в играх с полем среды

В статье представлены оптимальные коардинационные коррелированные равновесия для игр с полем среды в непрерывном времени. Авторы приводят формулировку линейного программирования, доказывают существование, разрабатывают алгоритм обучения с нулевым разрежением с явными скоростями сходимости, подкрепленные численными примерами.

arxiv arXiv cs.LG · 7 д назад

EEG Foundation Models для обнаружения всплесков-подавления в ICU

Исследование оценивает EEG Foundation Models для обнаружения событий всплесков-подавления в ЭЭГ ICU без калибровки по пациенту. REVE-base достиг наивысшего значения F1-с코ра по событиям 0,868 и сократил ошибку всплесков в минуту на 52,1% по сравнению с EEGNet. Результаты аблации показывают, что полная тонкая настройка превосходит другие стратегии, а предварительно обученный REVE-base превосходит случайную инициализацию на 0,723 точки F1 при 25% обучающих данных.

arxiv arXiv cs.LG · 7 д назад

Информационный анализ эффективного надзора в скрытой цепочке мыслей

Эта статья выявляет двойное падение в скрытой логике: затухание градиента и дрейф представлений. Предлагается траекториальный и пространственный надзор, показывая, что генеративное восстановление сохраняет информационную емкость лучше, чем геометрическое сжатие. Единый скрытый анализ измеряет взаимную информацию между скрытыми траекториями и шагами рассуждения, выявляя связь между информацией и производительностью в точности рассуждений.

arxiv arXiv cs.LG · 7 д назад

MakeupMirror улучшает сохранение атрибутов лица в моделях диффузии

MakeupMirror, модель передачи макияжа на основе диффузии, обеспечивает увеличение схожести при распознавании лица на 60% и снижение разницы в оттенке кожи на 50% по сравнению с Stable-Makeup. Модель сохраняет лицевые черты и оттенок кожи с экспертной оценкой 94% по критериям идентичности, работает с задержкой 0,7 секунды при использовании сэмплятора Левенберга-Маркуарда-Ланжевина.

arxiv arXiv cs.LG · 7 д назад

Сенсорно-моторные модели мира для восприятия, синхронизированного с действиями

Вводится сенсорно-моторная модель мира (SMWM), которая обучает компактные, действия-ориентированные скрытые представления на основе оффлайн-траекторий. Она использует регуляризацию обратных динамик для предотвращения коллапса представлений и обеспечения стабильных, интерпретируемых моделей мира без необходимости фиксированных кодировщиков или сложных регуляризаторов. SMWM достигает конкурентоспособных результатов по планированию в задачах 2D и 3D управления.

arxiv arXiv cs.LG · 7 д назад

Квантиль средних: метод ансамбля для минимакс оптимального обучения с усилением

Новый метод ансамбля для конечных горизонтов МДП использует оценки на основе квантилей для достижения минимакс оптимальных границ потерь. Он устраняет зависимость от подсчета неопределенности и предоставляет теоретическое обоснование для ансамблевого поиска в обучении с усилением.

arxiv arXiv cs.LG · 7 д назад

Pose6DAug: Физически обоснованный обмен объектами в многокамерном виде

Pose6DAug обеспечивает аугментацию данных для роботов путем обмена объектами в успешных сессиях, при этом сохраняя физически допустимые траектории 6D ориентации. Оно работает в 3D с использованием сетки, закрепленной за временно согласованными ориентациями, обеспечивая согласованность во множестве камер и физическую обоснованность. Тонкая настройка политики VLA на этом аугментированном данных повышает показатели успешного обнаружения новых объектов на 16,5% по сравнению с современными базовыми моделями.

arxiv arXiv cs.LG · 7 д назад

Генерируемые LLM-ядра GPU подвергаются иллюзии корректности

Оценки с использованием проверок фиксированной формы пропускают реальные ошибки в ядрах GPU, генерируемых LLM. Контролируемый корпус из 24 ядер, включающий 9 вариантов с ошибками транскрипции, показывает, что оракул, учитывающий схему операций, обнаруживает все сбои и проходит все корректные проверки, с одинаковыми результатами на пяти архитектурах GPU.

arxiv arXiv cs.LG · 7 д назад

Адаптивное обучение с использованием ЛЛМ повышает вовлеченность и эффективность

Новая система использует поддержку по тематике для адаптации стратегий обучения в зависимости от успеваемости студентов и предмета. Результаты A/B тестирования с 656 разговорами студентов показывают, что модель снижает количество взаимодействий на 3 шага и повышает конверсию стратегий обучения с 19,1% до 28,1% при использовании стохастического роутера.

arxiv arXiv cs.LG · 7 д назад

MedRLM: Рекурсивная мультимодальная интеллектуальная система в области здравоохранения

MedRLs обеспечивает долгосрочное клиническое мышление за счёт рекурсивного анализа данных пациента в тексте, изображениях, сенсорах и руководствах. Оно интегрирует специализированные агенты и граф памяти клинических доказательств для связи наблюдений с доказательствами и критериями направления, поддерживая сенсорное триггерное мышление и ревью клиницистов с учётом неопределённости.

arxiv arXiv cs.LG · 7 д назад

MELT и SALT: Мультимодальные модели контрастного обучения для земных вложений

MELT и SALT — это мультимодальные модели контрастного обучения, использующие непарные геосpatial данные для улучшения вложений местоположения. Оба достигают результатов, равных двум лучшим базовым моделям с двумя модальностями, на четырех задачах, но добавление дополнительных модальностей не приводит к стабильному улучшению результатов, что указывает на то, что основным ограничением производительности является конструкция кодера местоположения. MELT обеспечивает более стабильную обучение и лучше подходит для будущего масштабирования моделей.

arxiv arXiv cs.LG · 7 д назад

Машинное обучение предсказывает возраст беременности по магнитно-резонансной томографии плода

Пайплайн на основе машинного обучения, использующий многомодальные данные магнитно-резонансной томографии плода, позволяет предсказать возраст беременности при рождении с R2, равным 0,13, и средней абсолютной ошибкой в 2,74 недели. Он достигает точности 0,77, чувствительности 0,59 и специфичности 0,82, при этом длина шейки и параметры T2* плаценты являются ключевыми признаками. В данной работе представлено доказательство концепта предсказания преждевременных родов с использованием МРТ и машинного обучения.