korshunov.ai — новости ML

Результаты

Сортировка

Лаборатория Тема Источник

Определение поведения агентов через процедуры траекторий

Мы предлагаем метод идентификации агентов по их поведенческим отпечаткам, достигающий точности 85,7% при присвоении неизвестных траекторий правильным агентам. Используя ProcGrep, мы анализируем поведение кодирующих агентов в SWE-Bench, и находим, что модели из схожих периодов выпуска или distilled друг от друга демонстрируют более близкую поведенческую схожесть, с показателем дивергенции Дженсена-Шанна 0,25.

Определение поведения агентов через процедуры траекторий

ActiveSAM: Быстрый и точный открытие-словарный сегментация

ROVE: обучение с помощью вмешательств человека для манипуляции робота-человека

ExpRL: Исследовательская RL для среднего обучения LLM

HABC улучшает RL-настройку VLAs с разреженными результатами

Геометрическая модель действий для обучения политик роботов

HalBench проверяет 29 открытых моделей на сикофантизм и халлюцинации

Адаптивный функциональный градиентный спуск с гарантиями сходимости

Единая кausalная классификация источников смещений распределений в RL

Ключевые свойства для эффективного рассуждения код-интерпретатора

CrossMaps: Семантическая картирование с учетом уверенности для навигации ровера

CircuitLasso: масштабируемое обучение схем для интерпретируемости LLM

Каузальный подход к аудиту раскрытий синтетических данных

Метод резидуального обучения с использованием направляющего контроля ошибки для балансировки пяти шаров на реальных роботах

PACT: Делегирование малого языкового модели для реактивного обучения с подкреплением

После-последовательные операторы ложной фальсификации не улучшают точность в малых моделях кода

TuneJury: Открытый метрический инструмент для выравнивания предпочтений в генерации музыки

TokenPilot: Эффективное управление контекстом для агентов LLM

KVEraser: Эффективное локальное удаление контекста в LLMs

Атака RING: использование дифференциальной конфиденциальности в распределённом обучении для скрытия сигналов бэкдора