AI agents
arxiv arXiv cs.CL · 6 д назад

LedgerAgent: структурированный статус для агентов вызова инструментов, соблюдающих политику

LedgerAgent вводит структурированный журнал для поддержания состояний задач отдельно в агентах вызова инструментов. Он превращает эти состояния в промпты и обеспечивает соблюдение политических ограничений до выполнения инструмента, что снижает нарушения политики и улучшает производительность в областях обслуживания клиентов.

arxiv arXiv cs.AI · 6 д назад

AI Экономист-агент: Кадровая аналитическая платформа в области экономики

AI Экономист-агент использует RAG, графы знаний и ЛЛМ для генерации экономических историй, основанных на теории и данных. Он обеспечивает аналитику на основе моделей, извлечение доказательств и генерацию отчетов, гарантируя экономическую согласованность и отслеживаемость через явные вычисления моделей.

arxiv arXiv cs.AI · 6 д назад

Управление задачами снижает задержку очереди на 14-75% на масштабе предприятия

Управление задачами вводит инференс приоритета, объединение связанных событий и прерывание, чтобы обеспечить непрерывную работу в корпоративной ИИ. Оно снижает задержку высокоприоритетных очередей на 14-77% и улучшает точность связанных событий более чем на 20 процентных пунктов на масштабе предприятия, решая шум при открытии агентов как основной барьер.

arxiv arXiv cs.AI · 6 д назад

Внимание-ориентированный SAC для прогнозирования пористости в аддитивном производстве

Многоуровневый экстрактор признаков на основе внимания, интегрированный с Soft Actor-Critic, улучшает прогнозирование пористости и оптимизацию параметров процесса в лазерной сварке порошков. Метод достиг значения сходимости 322,79 за 14 эпизодов, превосходя DQN, PPO, TD3 и обычный SAC по скорости сходимости и стабильности.

arxiv arXiv cs.AI · 6 д назад

Сенсорно-моторные модели мира для восприятия, синхронизированного с действиями

Новая сенсорно-моторная модель мира (SMWM) обучает компактные, действия-связанные скрытые представления на основе отложенных траекторий. Она использует регуляризацию обратных динамик для предотвращения коллапса представлений и синхронизирует скрытые состояния с управляемыми степенями свободы окружающей среды, обеспечивая стабильное обучение без сложных регуляторов или замороженных компонентов. SMWM достигает конкурентоспособной производительности планирования в задачах 2D и 3D управления.

arxiv arXiv cs.AI · 6 д назад

Двухагентная архитектура для проверенной перевода между моделями

Двухагентная архитектура преобразует протоколы экспериментов на естественном языке в исполняемые команды для платформ роботизированных лабораторий. Она использует агента парсера и движок отображения на основе правил для перевода протоколов, при этом агент проверки с использованием гетерогенной нейросети обеспечивает точность и запускает самокоррекцию. Архитектура успешно позволяет реализовывать автономное выполнение экспериментов на микроплашках, таких как тест Брадфорда.

arxiv arXiv cs.AI · 6 д назад

ScaffoldAgent: Утилиты-ориентированный динамический оптимизацией структуры

ScaffoldAgent вводит рамку с утилиты-ориентированным управлением для динамической оптимизации структуры в открытых глубоких исследованиях. Он моделирует эволюцию структуры через операции расширения, сжатия и редактирования, управляемые механизмом обратной связи, оценивающим прирост поиска, структурную целостность и качество генерации. Эксперименты показывают, что он улучшает генерацию длинных отчётов и фактическую опору по сравнению с существующими агентами.

arxiv arXiv cs.AI · 6 д назад

Адаптивное обучение с помощью LLM повышает вовлеченность и эффективность

Новая адаптивная система обучения с помощью LLM использует поддержку тематических запросов для повышения вовлеченности студентов. Она превосходит статические модели в симуляции и демонстрирует реальную эффективность, снижая количество взаимодействий на 3 шага и увеличивая коэффициент преобразования упражнений до 28,1% с помощью стохастической стратегии.

arxiv arXiv cs.AI · 6 д назад

RACL: Слой управления агентом для мета-оптимизации обучения

RACL вводит агента принятия решений, который управляет поведением мета-оптимизационного поиска, не заменяя оптимизаторы или изменяя ограничения. Он улучшает или сохраняет ключевые политики в экспериментах по маршрутизации транспортных средств, снижая среднюю стоимость на 8,337% по сравнению с Fixed и на 1,605% по сравнению с политиками, активированными при стагнации, без значительного увеличения вычислительной нагрузки.

arxiv arXiv cs.AI · 6 д назад

MedRLM: Рекурсивная мультимодальная интеллектуальная система здравоохранения

MedRLs обеспечивает долгосрочное клиническое мышление за счёт рекурсивного анализа данных пациента в тексте, изображениях, сенсорах и руководствах. Оно интегрирует специализированные агенты и граф памяти клинических доказательств для связи наблюдений с доказательствами и критериями редиректа, поддерживая сенсорное триггерное мышление и ревью клинистов с учётом неопределённости.

arxiv arXiv cs.AI · 6 д назад

Глубокое обучение с подкреплением для улучшения ИИ в играх

В этой статье предлагается рамка применения глубокого обучения с подкреплением в ИИ для игр, направленная на создание более реалистичных и человеческих персонажей. В статье рассматриваются текущие ограничения при внедрении агентов машинного обучения в игры и выявляются ключевые научные задачи, которые могут ускорить внедрение ИИ в видеоигровую индустрию.

arxiv arXiv cs.AI · 6 д назад

ScholarQuest: База для агентного поиска академических работ с использованием классификации

ScholarQuest — это масштабная база для агентного поиска академических статей, построенных на основе 1000 тем из области компьютерных наук и четырех научных целей. В ней включены масштабируемые методы построения ответов и общий ретриев-бэкенд ScholarBase, обеспечивающий воспроизводимую оценку. Результаты показывают, что агентные методы превосходят базовые методы поиска, при этом лучший агент достигает 0,314 Recall@100 и 0,355 Recall@All, что указывает на значительный потенциал для улучшения.

arxiv arXiv cs.AI · 6 д назад

MAMO: Многоагентная система для многокритериальной оптимизации с ограничениями

MAMO вводит подход многоканального обучения с помощью репликации для решения задачи балансировки минимизации затрат и удовлетворения ограничений в динамических средах. Он разделяет выполнение задачи на выбор весов вознаграждения, рассматривая выбор весов как задачу обучения, что позволяет достигать более автономных и устойчивых решений.

arxiv arXiv cs.AI · 6 д назад

SPOT-E: Метод формирования энтропии на этапе тестирования с визуальными фокусами для замороженных моделей ВЛ

SPOT-E представляет метод на этапе тестирования, использующий визуальные фокусы для усиления фиксации доказательств в замороженных моделях визуально-языковых моделей. Метод использует низкоэнтропийные анкоры и цель формирования энтропии для снижения неопределенности ответов, при этом сохраняя высокодоверительные токены, что повышает устойчивость к визуальным искажениям на различных наборах данных и в различных семействах моделей ВЛ.

arxiv arXiv cs.AI · 6 д назад

Настраивание моделей VLA требует меньше слоев, чем думалось

Модели вид-язык-действие демонстрируют серьезную слоевую редуndancy, несмотря на большое количество параметров. Метод сжатия без обучения, использующий центрированное ядерное выравнивание, удаляет парные слои, снижая глубину модели до 50% и позволяя ускорить обучение на 40-50% и инференс на до 30% без потери производительности, что подтверждено на симуляционных и реальных роботизированных задачах.

arxiv arXiv cs.AI · 6 д назад

Доверие-ориентированный автоматизированный анализ студентских научных моделей

Модель на основе визуального анализа с параметрической эффективной адаптацией оценивает рисунки студентов в образовательной среде. Она использует оценку с учетом доверия для автоматического анализа высокодоверительных ответов, откладывая неопределенные ответы на ручную проверку, что повышает надежность и практическую применимость при масштабных оценках.

arxiv arXiv cs.AI · 6 д назад

Lagrange: Открытый словарный разреженный фреймворк для целостного управления автомобилем

Lagrange представляет открытый словарный, энергетический разреженный фреймворк для обобщённого целостного управления автомобилем. Он использует модели визуально-языковых моделей для генерации объектных предложений, не зависящих от класса, и кодирует их в непрерывные семантические токены, обеспечивая устойчивое обобщение на аномальные сценарии, при этом соблюдая кинематику автомобиля за счёт минимизации лагранжевой действия.

arxiv arXiv cs.AI · 6 д назад

Новый подход DTL для диагностики неисправностей при ограниченном объеме данных

Новый метод глубокой передачи знаний использует нелинейности систем для генерации диагностических данных при крайне ограниченном объеме данных. Данный подход использует периодическую процедуру многократного возбуждения и новую технику визуализации данных для расширения ограниченных данных о вибрациях, что позволяет проводить эффективную диагностику неисправностей с использованием предобученных CNN. Экспериментальные результаты на рельсовом контактном проводе подтверждают эффективность метода.

arxiv arXiv cs.AI · 6 д назад

SoftSkill: сжатие поведенческих навыков для адаптации в контексте

SoftSkill предлагает метод сжатия естественных языковых навыков в компактные скрытые предпосылки, что улучшает выполнение задач на SearchQA, LiveMath и DocVQA. Метод превосходит SkillOpt на 5,2–12,5 баллов по ключевым метрикам, при этом заменяя сотни или тысячи токенов Markdown на несколько виртуальных токенов.