Research paper
arxiv arXiv cs.CL · 6 д назад

Фреймворк мультиагентной транзакционной памяти

Фреймворк мультиагентной транзакционной памяти (MATM) обеспечивает хранение и извлечение траекторий, сгенерированных агентами на уровне популяции. Он позволяет производящим агентам делиться процедурными знаниями с потребляющими агентами, что улучшает выполнение задач и снижает количество шагов взаимодействия в интерактивных средах, таких как ALFWorld и WebArena, без координации или совместной тренировки.

arxiv arXiv cs.CL · 6 д назад

Стабилизация намерения инструмента в потоковом RAG

Исследование оценивает стабилизацию намерения инструмента в потоковом RAG, определяя момент, когда спекулятивные запросы на инструменты сходятся к правильным ответам. На бенчмарке CRAG 73,9% запросов позволяют значительное скрытие задержки, при этом ранняя стабилизация наблюдается в вопросах с прямым извлекаемым доказательством. Тип вопроса значительно предсказывает раннюю или позднюю стабилизацию, что позволяет определить, когда спекулятивные триггеры оказываются эффективными.

arxiv arXiv cs.CL · 6 д назад

PASQA: модель оценки качества речи с фокусом на интонационных акцентах

PASQA — это модель оценки качества речи, предназначенная для оценки правильности интонационных акцентов в синтезированной японской речи. Она использует набор данных с контролируемыми ошибками акцентов и включает в себя саморегулирующее обучение, синтез с учетом моры, потери ранжирования и локализацию ошибок акцентов, чтобы обеспечить высокую точность обнаружения ошибок акцентов у разных говорящих, превосходя традиционные модели по согласованию с человеческими оценками.

arxiv arXiv cs.CL · 7 д назад

Техники оптимизации инференса, ориентированные на токены

В этой статье представлено четырехуровневое техническое архитектурное решение для оптимизации инференса, ориентированного на токены, включающее Мульти-модельное объединение, Оптимизацию модели, Сочетание вычислений и модели и Сочетание вычислений, сети и модели. В статье рассматриваются ключевые технологии и состояние отрасли, анализируются их практическая ценность в сокращении затрат на токены, повышении эффективности сервиса и обеспечении стабильного поставки токенов.

arxiv arXiv cs.CL · 7 д назад

CATCH-ME, если вы RAG: Мультимедийный датасет для противодействия ненависти и недостоверной информации

CATCH-ME представляет первый масштабный мультимедийный датасет контекстуально аннотированных мульти-переводных диалогов противодействия ненависти и недостоверной информации. Датасет охватывает пять языков и сосредоточен на семи маргинализированных группах, диалоги основаны на проверенных источниках фактической проверки и включают аннотации на уровне документов и фрагментов для систем RAG.

arxiv arXiv cs.LG · 7 д назад

Перекрестная оценка AUC для оценки реалистичного детектора фейков

Новый метрика, перекрестная оценка AUC (Cross-AUC), решает недостатки традиционной оценки AUC, средняя по доменам AUC и включает поляризацию предсказаний через расстояние Вассерштейна. Она лучше отражает реальную производительность при сдвигах доменов и предоставляет интерпретируемые данные о деградации детектора.

arxiv arXiv cs.LG · 7 д назад

XGBoost-Forget для машинного забвения в обнаружении сетевых инцидентов

XGBoost-Forget обеспечивает эффективное машинное забвение для моделей XGBoost на табличных сетевых данных об инцидентах. Оно сохраняет производительность модели, при этом обеспечивает более быстрое забвение по сравнению с полным переобучением, решая пробел в исследованиях машинного забвения для табличных данных в обнаружении сетевых инцидентов.

arxiv arXiv cs.LG · 7 д назад

Каталог Chandra-Gaia использует машинное обучение для разрешения соответствий между источниками рентгеновского и оптического излучения

Машинный интеллект разрешает неопределённые соответствия между источниками рентгеновского излучения Chandra и оптического излучения Gaia, используя данные о яркости, цвете и расстоянии. Он идентифицирует соответствия для 113 000 из 254 000 источников Chandra, находит вероятные несколько соответствий для 7 000 и проверяет свою производительность на обзоре COUP с точностью 95% без данных о положении.

arxiv arXiv cs.LG · 7 д назад

LOCUS: локальная коллекция законов для США

LOCUS предоставляет машинно-читаемый доступ к муниципальным и округовым постановлениям США, охватывающим 9239 городов и округов. В нём содержится слой, синхронизированный по округам, для 2309 из 3144 округов США, охватывающих большинство населения. Корпус, построенный с использованием распознавания печатных символов и метаданных, позволяет проводить исследования по правовой неясности и патернализму с использованием моделей на базе ModernBERT.

arxiv arXiv cs.AI · 7 д назад

XGBoost-Forget для машинного забвения в системах обнаружения сетевых инцидентов

XGBoost-Forget обеспечивает эффективное машинное забвение для моделей XGBoost на табличных сетевых данных об инцидентах. Оно сохраняет производительность модели, при этом обеспечивает более быстрое забвение по сравнению с полным переобучением, решая пробел в исследованиях машинного забвения для табличных данных в системах обнаружения сетевых инцидентов.

arxiv arXiv cs.AI · 7 д назад

Классификация связывает потребности присматривающих с технологиями в области психического здоровья

Новая классификация связывает психическое здоровье присматривающих при болезни Альцгеймера и деменции с технологическими вмешательствами. Она выявляет пробелы в поддержке таких вопросов, как напряжение в отношениях и выгорание сострадания, и предлагает общую рамку для проектирования технологий, ориентированных на человека и основанных на клинических данных.

arxiv arXiv cs.CL · 7 д назад

Dango: строго однолингвальный LLM для исследований SLA

Dango — это LLM с 1,8 миллиарда параметров, разработанный для изучения второго языкового приобретения на японском языке в английском. Он использует метод фильтрации для минимизации английской контаминации в монолингвальной предобученной фазе, сохраняя реалистичное воздействие первого языка. После тонкой настройки на уроки, сгенерированные LLM, Dango создает человечески естественные выводы на втором языке, превосходя нефильтрованные и стандартные многолингвальные модели.

arxiv arXiv cs.CL · 7 д назад

LOCUS: локальная корпорация нормативных актов для Соединенных Штатов

LOCUS предоставляет машинно-читаемый доступ к почти всем публично доступным нормативным актам муниципальных и городских органов США, охватывая 9239 городов и округов. В нем включена гармонизированная доступная слоистая структура для 2309 из 3144 округов США, охватывающих большинство населения. Корпора, построенная с использованием распознавания печатных символов и метаданных для воспроизводимости, позволяет проводить масштабный анализ местного законодательства, включая такие параметры, как прозрачность и патернализм, с использованием моделей на базе ModernBERT.

arxiv arXiv cs.LG · 7 д назад

Обнаружение структурных искажений через сдвиги причинных механизмов

Эта статья представляет алгоритм StruBI, который выявляет скрытые смещения из-за конфликтов и выбора путем анализа сдвигов причинных механизмов в различных средах. Алгоритм формализует критерий на основе мутуальной информации для обнаружения структурных искажений и демонстрирует превосходную производительность при восстановлении искаженных переменных на синтетических и реальных данных.

arxiv arXiv cs.LG · 7 д назад

Расширение системы аварийного торможения с использованием неприменяемых данных через мета-обратную связь в полуосуществленном обучении

Мета-обратная связь в полуосуществленном обучении позволяет масштабировать систему автоматического аварийного торможения с использованием огромных объемов неприменяемых данных из автопарков. Устойчивый подход снижает ошибки псевдометок и подавляет риски гиперболизации, обеспечивая соотношение 100:1 между положительными и ложными активациями и на 35% больше километров безаварийного вождения по сравнению с базовым вариантом на основе правил в реальных условиях эксплуатации.

arxiv arXiv cs.LG · 7 д назад

Нейронные сети с учетом сдвига домена для оценки несбалансированной массы

Предлагается нейронная сеть с учетом сдвига домена для оценки несбалансированных масс на вращающихся шпиналях при изменяющихся режимах работы. Модель использует максимальное среднее отклонение для синхронизации представлений признаков между различными операционными доменами, повышая точность прогноза при том, что поведение системы отличается от условий обучения. Результаты показывают ее эффективность в приложениях мониторинга состояния конструкций, где сдвиги доменов неизвестны или не учитываются.

arxiv arXiv cs.LG · 7 д назад

TransitNet достигает точности 95,2% при поиске транзитов в условиях низкого уровня шума

TransitNet, компактная система глубокого обучения с усилением внимания, достигает точности 95,2% при поиске транзитов в условиях низкого уровня шума, превосходя TLS и BLS по значениям ROC-AUC и PR-AP. Он восстанавливает 93,0% введённых транзитов размером Земли и подземных планет, 97,4% введённых транзитов полностью охвачены оцененными окнами транзитов, и успешно восстанавливает все 34 подтверждённых планет Кеплера с средней ошибкой в середине 1,24 часа.

arxiv arXiv cs.LG · 7 д назад

Нулевая активная акустическая получение признаков через эlicitацию LLM

Новый фреймворк позволяет осуществлять нулевое активное получение признаков, используя LLM для извлечения только дискриминативных статистик, таких как одиночные отклонения и парные ковариации. С помощью максимальной энтропийной закрытия решается неопределенность при выборе признаков и превосходит сам LLM, особенно в сложных случаях пациентов с ИБД, где уровень диагностической неопределенности высок.

arxiv arXiv cs.LG · 7 д назад

Квантовое расширение GAN не показывает преимуществ в МРТ мозга

Управляемый бенчмарк показывает отсутствие значимого роста производительности за счёт квантовых генеративных моделей при расширении МРТ мозга. Синтетические образцы, созданные квантовыми и классическими GAN-моделями, статистически не различимы, и обе модели демонстрируют коллапс моделей и образцы за пределами распределения, особенно при низких долях данных. Исследование заключает, что квантовое расширение не превосходит классические методы и действует скорее как регуляризация, чем как расширение данных.

arxiv arXiv cs.LG · 7 д назад

Устойчивый последовательный тест условной независимости

Новый метод вводит адаптивную ставку с керновыми статистиками для проверки условной независимости, снижая инфляцию ошибки первого рода из-за ошибки оценки. Он превосходит существующие последовательные подходы Model-X как в синтетических, так и в реальных задачах справедливости, сохраняя высокую мощность, при этом более устойчив к ошибкам оценки распределения.