Reasoning models — korshunov.ai

Reasoning models Страница 1 / 35

T-API-совместимый цикл ReAct для оптических сетей

Вводится T-API-совместимый цикл ReAct с агентной архитектурой для оптических сетей, обеспечивающий управление на основе намерений и замкнутого цикла. Доменные специализированные композитные инструменты обеспечивают 90% оракульной проверки корректности и снижают использование токенов в три раза по сравнению с обобщенными инструментами.

arxiv arXiv cs.AI · 8 д назад

Теория поведения потребителей на основе больших языковых моделей: новая область исследований

В этой статье представлено понятие теории поведения потребителей на основе больших языковых моделей, новой области, анализирующей, как большие языковые модели принимают решения о потреблении от имени пользователей. Теория объединяет исследования по принятию решений на основе больших языковых моделей, имитации поведения человека и извлечению предпочтений в рамках экономических принципов, выявляя ключевые пробелы в допущениях, таких как рациональность и гетерогенность в агентных рынках.

arxiv arXiv cs.AI · 8 д назад

LegalHalluLens: аудит галлюцинаций в правовом ИИ

LegalHalluLens представляет рамку для аудита галлюцинаций ИИ в правовых контекстах, анализируя профили галлюцинаций при вводе по четырём категориям претензий. Оно выявляет разрыв в 38-40 баллов между претензиями о обязательствах/численных и временных претензиях, и показывает, что две системы с одинаковыми показателями 52% галлюцинаций могут иметь противоположные направления риска. Рамка использует индекс направления риска и калиброванные дебатные потоки для снижения обнаружения выдуманных данных на 45% и улучшения ответственности при внедрении правового ИИ.

T-API-совместимый цикл ReAct для оптических сетей

Теория поведения потребителей на основе больших языковых моделей: новая область исследований

LegalHalluLens: аудит галлюцинаций в правовом ИИ

Катастрофическое забвение — это низкое ранговое: теория функционального пространства

Влияние исходного языка в межязыковом обучении в контексте

ProvenanceGuard: проверка фактичности с учетом источника для агентов на основе LLM с использованием MCP

Синтетический личный опыт ИИ в поддержке уходчика

ScaFE: Использование больших языковых моделей для извлечения клинически значимых признаков шрамов

Кадровая ИИ-архитектура снижает ошибки диагностики в здравоохранении

HyGRAG: Единая платформа для контекст- и отношение-ориентированных графовых RAG

IsabeLLM: AI-Driven Theorem Proving for Consensus Verification

Качествосознательная самодистилляция для подключения интерфейса

ALERCЕ запускает систему текст-в-СУЛЬ с использованием больших языковых моделей

Изучение справедливых парето-оптимальных политик в многокритериальной робастной обучении

Первое доказательство, вторая партия: ИИ проверен на задачах исследовательского уровня математики

Введение в COGNITIVE ATROSPHY BENCH для взаимодействий LLM в области психического здоровья

Переиспользование метакnowledge в обучении с усилением

Продолжительность работы флеш-памяти как износа капитала в памяти робота

WEQA: Вопросы о здоровье в носимых устройствах с адаптивным запросом агентской логики

Разрыв в измерении в законодательстве Европейского союза по автоматизации