Reasoning models — korshunov.ai

Reasoning models Страница 1 / 35

Адаптивное планирование данных улучшает обучение на основе реверсии для больших языковых моделей

Адаптивное планирование данных (ADS) вводит двууровневую систему планирования данных, которая заменяет равномерное выборку на адаптивное распределение по семантическим кластерам и выборку образцов на границах политики. Экспериментальные результаты показывают, что ADS улучшает среднюю точность на 5,2% по сравнению с GRPO при трех больших языковых моделях и семи задачах логического мышления, что демонстрирует его эффективность как универсальной стратегии для постобучения больших языковых моделей на основе реверсии.

Адаптивное планирование данных улучшает обучение на основе реверсии для больших языковых моделей

Приложение Curiosity как лингвистическое вмешательство в обучение с помощью ЛЛМ

ORBIT: Обучение-бесплатное управление многими атрибутами поведения

Классификация концептуальной синхронизации в диалогах человека-робота

Первые токены в трансформерах: механические корни идентичности языка

Кадр P4IR повышает точность соблюдения кода на основе больших языковых моделей

Закрепление знаний в графе помогает LLM только при ответах на вопросы, основанные на фактах, не входящих в обучающий набор

LLMs используют логику разности для изучения причинной структуры

Разнообразие персонажей в историях, сгенерированных LLM

Модели речи-текста латентно транскрибируют речь в промежуточных слоях

FACTOR обеспечивает адаптивную проверку фактичности в генерации длинных текстов

Система Buddy: монитор нестабильности на языке Rust с контролем неопределенности на основе NER для многоуровневой инференции LLM

VADAOrchestra: нейросимволическая оркестрация адаптивных рабочих потоков

Вариантно-калиброванная модуляция для декодирования ЛЛМ

Gazer: обучение-безопасная коррекция семантики для автобуровых визуальных моделей

Мультимодальный цепочка мыслей: Возможности и ограничения

Ключевые факторы в RL для логического мышления в LLM раскрыты

Контекстуально-осознанное дистилляция и аблация для Text2DSL

Малые языковые модели превосходят передовые LLM в извлечении связей

PeerCheck: Улучшение академических отзывов, генерируемых ЛЛМ