Reasoning models — korshunov.ai

Reasoning models Страница 1 / 35

Прогресс, обусловленный ИИ, в стабильных меню общественных благ

Эксперименты по теме "Стабильные меню общественных благ" на конференции EC 2025 показывают, что промпты, основанные на человеческой интуиции, улучшают производительность ЛЛМ и мульти-переводные взаимодействия усиливают амбициозные шаги. Однако при сравнении с первым годом аспиранта, использующим непубликованный рукописный материал, ЛЛМ оказывается слегка менее эффективным.

arxiv arXiv cs.AI · 9 д назад

PACT: Делегирование малого языкового модели для реактивного обучения с подкреплением

PACT объединяет реактивную политику RL с малой языковой моделью на 2 миллиона параметров для генерации и проверки планов действий. План от малой языковой модели выполняется напрямую, если он подтверждается как безопасный, выполнимый и полный, что позволяет обойти политику RL. PACT превосходит базовые методы на трёх всё более сложных средах FrozenLake.

arxiv arXiv cs.AI · 9 д назад

ActiveSAM: Быстрый и точный анализ семантической сегментации с открытым словарем

ActiveSAM — это рамка без обучения и с нулевым обучением, которая улучшает SAM 3 для семантической сегментации с открытым словарем, определяя активный набор классов, зависящий от изображения. Оно улучшает баланс между скоростью и точностью, превосходя SegEarth-OV3 на +1,4 mIoU в среднем и работает до 5,5 раз быстрее на датасетах с большим словарем, при этом демонстрируя сильную устойчивость при искажении изображений.

arxiv arXiv cs.AI · 9 д назад

FusionRS: Первый масштабный датасет RGB-инфракрасного дистанционного зондирования

FusionRS представляет первый масштабный датасет RGB-инфракрасно-текстового типа для моделирования визуально-языковых моделей дистанционного зондирования. Он синхронизирует RGB и инфракрасные изображения с инфракрасно-осознанными описаниями, позволяя использовать двумодальные визуально-языковые основные модели. Эксперименты показывают улучшение синхронизации RGB-инфракрасных изображений, поиска и описания, при этом исследования с устранением факторов подтверждают критическую роль модальности-специфического текстового надзора.

arxiv arXiv cs.AI · 9 д назад

Фаза в нейронных представлениях: внутренний тест Оппенгейма-Лима

Классификаторы изображений, такие как PRISM2D, GFNet и ViT-B/16, показывают, что фаза, а не модуль, определяет предсказания в скрытых слоях. ResNet-50 раскрывает скрытый код знака в поздних блоках, что указывает на то, что идентичность фазы/знака существует во всех архитектурах, хотя она выражается по-разному из-за механизмов активации и выдачи.

Прогресс, обусловленный ИИ, в стабильных меню общественных благ

PACT: Делегирование малого языкового модели для реактивного обучения с подкреплением

ActiveSAM: Быстрый и точный анализ семантической сегментации с открытым словарем

FusionRS: Первый масштабный датасет RGB-инфракрасного дистанционного зондирования

Фаза в нейронных представлениях: внутренний тест Оппенгейма-Лима

Факторизованные нейронные операторы разбивают динамические и устойчивые реакции

CEAP снижает дисперсию в открытии циркуитов в LLM

Адаптивный функциональный градиентный спуск с гарантиями сходимости

Единая кausalная классификация источников смещений распределений в RL

Ключевые свойства для эффективного рассуждения код-интерпретатора

CrossMaps: Семантическая картирование с учетом уверенности для навигации ровера

CircuitLasso: масштабируемое обучение схем для интерпретируемости LLM

Гибридная конволюционная VAE для криптовалютных поверхностей волатильности

Метод резидуального обучения с использованием направляющего контроля ошибки для балансировки пяти шаров на реальных роботах

Dynestyx: Вероятностное программирование для динамических систем

Определение поведения агентов через процедуры траекторий

Аналитическая торсия и поглощение спектрального разрыва в производительности постоянного лапласиана

PACT: Делегирование малого языкового модели для реактивного обучения с подкреплением

ActiveSAM: Быстрый и точный открытие-словарный сегментация

Нейронная модель взаимодействия экспозиции для интерпретируемого эффекта лечения