Research paper
arxiv arXiv cs.LG · 6 д назад

SME-OFU: Подход на основе множества членов для стохастических линейных контекстуальных лент

В статье предложена алгоритм SME-OFU, новый подход для стохастических линейных контекстуальных лент с ограниченным шумом вознаграждения. Он достигает границы потерь O(log T) за счёт использования оценки множества членов и оптимизма в условиях неопределённости. Симуляции показывают, что SME-OFU превосходит под-гауссовый шум в качестве эталона при ограниченном шуме вознаграждения.

arxiv arXiv cs.LG · 6 д назад

TESSERA и AlphaEarth встраивания позволяют проводить мелкое картирование LCZ в швейцарских городах

Исследование, охватывающее пять швейцарских городов, сравнивает встраивания TESSERA и AlphaEarth с традиционными данными Sentinel с целью масштабирования карт локальных климатических зон до разрешения 10 метров с использованием U-Net на основе внимания. TESSERA стабильно превосходит как Sentinel-1/2, так и AlphaEarth, достигая показателей IoU от 0,59 до 0,69 и от 0,77 до 0,82. Результаты показывают, что встраивания сокращают ручную предобработку и обеспечивают масштабируемое, воспроизводимое картирование LCZ, хотя для дальнейшего повышения точности ключевую роль играет улучшение исходных данных.

arxiv arXiv cs.LG · 6 д назад

Оптимальные коардинационные коррелированные равновесия в играх с полем среды

В статье представлены оптимальные коардинационные коррелированные равновесия для игр с полем среды в непрерывном времени. Авторы приводят формулировку линейного программирования, доказывают существование, разрабатывают алгоритм обучения с нулевым разрежением с явными скоростями сходимости, подкрепленные численными примерами.

arxiv arXiv cs.LG · 6 д назад

Федеративное управление риском через сжатие кривой риска

Новый метод федеративного управления риском решает проблемы несоответствия в прогнозах на уровне больниц. На реальных данных о черепно-мозговых опухолях из 20 учреждений объединенная калибровка не срабатывает на 40% сайтов, при этом один из них превышает порог ложных отрицательных результатов на 7,8 процентных пунктов. Предложенный протокол на основе сжатия кривой риска использует эмпирические кривые риска и гиперпараметр n0=19, обеспечивая 2,7/20 нарушений охвата при растяжении предсказательного набора в 2,0 раза, при этом сохраняя междусайтовые гарантии и обеспечивая отсутствие передачи данных на уровне пациентов на любом из сайтов.

arxiv arXiv cs.LG · 6 д назад

PASQA: модель оценки качества речи с фокусом на интонационные акценты

PASQA — это модель оценки качества речи, разработанная для оценки правильности интонационных акцентов в синтезированной японской речи. Она использует набор данных с контролируемыми ошибками акцента и достигает высокой точности при ранжировании степени серьезности ошибок акцента, превосходя традиционные модели и лучше соответствует оценкам людей.

arxiv arXiv cs.LG · 6 д назад

Эффективная размерность определяет обобщение в квантовых моделях зрения

Квантовые модели зрения демонстрируют лучшее обобщение при большем запутывании или квантовом шуме, явления, объединяющиеся через эффективную размерность квантового ядра признаков, формирующегося под действием шума. Эта размерность выступает в качестве механизма регуляризации в режимах переобучения, при амплитудном затухании тестовая точность улучшается на до 13% вдоль инвертированного-U оптимального диапазона.

arxiv arXiv cs.LG · 6 д назад

Обнаружение смещения концепций на основе обучаемых моделей: анализ и оценка

Этот исследовательский проект анализирует и оценивает алгоритмы обнаружения смещения концепций в нескольких категориях с использованием синтетических и реальных потоковых данных. В нем рассматриваются характеристики смещения и оцениваются показатели работы детекторов в условиях резких и постепенных смещений, чтобы улучшить понимание поведения смещения и применимости детекторов.

arxiv arXiv cs.LG · 6 д назад

QCPIKAN: квантово-классическая физически-обусловленная сеть Кольмогорова-Арнольда для уравнений в частных производных

QCPIKAN — первая квантово-классическая физически-обусловленная сеть Кольмогорова-Арнольда, разработанная для решения уравнений в частных производных. Она использует слои на основе чебышёвских полиномов КАН и параметризованных квантовых схем для встраивания физических ограничений в процесс обучения, обеспечивая экспоненциальное сходимость ошибки и снижение численной дисперсии. Проверена на сценариях проникновения в пористых средах, она превосходит существующие квантово-классические нейронные сети по точности предсказания, контролю ошибки и динамическому отслеживанию.

arxiv arXiv cs.CL · 6 д назад

Введение P-CHR AUC и CRR для семантической кэширования

Мы вводим метрики Точность-Кэш-Хит-Рейт (P-CHR) AUC и Калибровочная устойчивость (CRR), чтобы решить разрыв калибровки в семантическом кэшировании. Эти метрики оценивают точность на разных уровнях использования кэша и измеряют, насколько качество ранжирования в открытом режиме сохраняется при развертывании. Анализ показывает, что разрыв обусловлен тренировочными целями, а не масштабом данных, и пост-хай-калибровка лишь частично решает эту проблему.

arxiv arXiv cs.CL · 6 д назад

Фреймворк мультиагентной транзакционной памяти

Фреймворк мультиагентной транзакционной памяти (MATM) обеспечивает хранение и извлечение траекторий, сгенерированных агентами на уровне популяции. Он позволяет производящим агентам делиться процедурными знаниями с потребляющими агентами, что улучшает выполнение задач и снижает количество шагов взаимодействия в интерактивных средах, таких как ALFWorld и WebArena, без координации или совместной тренировки.

arxiv arXiv cs.CL · 6 д назад

Стабилизация намерения инструмента в потоковом RAG

Исследование оценивает стабилизацию намерения инструмента в потоковом RAG, определяя момент, когда спекулятивные запросы на инструменты сходятся к правильным ответам. На бенчмарке CRAG 73,9% запросов позволяют значительное скрытие задержки, при этом ранняя стабилизация наблюдается в вопросах с прямым извлекаемым доказательством. Тип вопроса значительно предсказывает раннюю или позднюю стабилизацию, что позволяет определить, когда спекулятивные триггеры оказываются эффективными.

arxiv arXiv cs.CL · 6 д назад

PASQA: модель оценки качества речи с фокусом на интонационных акцентах

PASQA — это модель оценки качества речи, предназначенная для оценки правильности интонационных акцентов в синтезированной японской речи. Она использует набор данных с контролируемыми ошибками акцентов и включает в себя саморегулирующее обучение, синтез с учетом моры, потери ранжирования и локализацию ошибок акцентов, чтобы обеспечить высокую точность обнаружения ошибок акцентов у разных говорящих, превосходя традиционные модели по согласованию с человеческими оценками.

arxiv arXiv cs.CL · 6 д назад

Техники оптимизации инференса, ориентированные на токены

В этой статье представлено четырехуровневое техническое архитектурное решение для оптимизации инференса, ориентированного на токены, включающее Мульти-модельное объединение, Оптимизацию модели, Сочетание вычислений и модели и Сочетание вычислений, сети и модели. В статье рассматриваются ключевые технологии и состояние отрасли, анализируются их практическая ценность в сокращении затрат на токены, повышении эффективности сервиса и обеспечении стабильного поставки токенов.

arxiv arXiv cs.CL · 6 д назад

CATCH-ME, если вы RAG: Мультимедийный датасет для противодействия ненависти и недостоверной информации

CATCH-ME представляет первый масштабный мультимедийный датасет контекстуально аннотированных мульти-переводных диалогов противодействия ненависти и недостоверной информации. Датасет охватывает пять языков и сосредоточен на семи маргинализированных группах, диалоги основаны на проверенных источниках фактической проверки и включают аннотации на уровне документов и фрагментов для систем RAG.

arxiv arXiv cs.LG · 7 д назад

Перекрестная оценка AUC для оценки реалистичного детектора фейков

Новый метрика, перекрестная оценка AUC (Cross-AUC), решает недостатки традиционной оценки AUC, средняя по доменам AUC и включает поляризацию предсказаний через расстояние Вассерштейна. Она лучше отражает реальную производительность при сдвигах доменов и предоставляет интерпретируемые данные о деградации детектора.

arxiv arXiv cs.LG · 7 д назад

XGBoost-Forget для машинного забвения в обнаружении сетевых инцидентов

XGBoost-Forget обеспечивает эффективное машинное забвение для моделей XGBoost на табличных сетевых данных об инцидентах. Оно сохраняет производительность модели, при этом обеспечивает более быстрое забвение по сравнению с полным переобучением, решая пробел в исследованиях машинного забвения для табличных данных в обнаружении сетевых инцидентов.

arxiv arXiv cs.LG · 7 д назад

Каталог Chandra-Gaia использует машинное обучение для разрешения соответствий между источниками рентгеновского и оптического излучения

Машинный интеллект разрешает неопределённые соответствия между источниками рентгеновского излучения Chandra и оптического излучения Gaia, используя данные о яркости, цвете и расстоянии. Он идентифицирует соответствия для 113 000 из 254 000 источников Chandra, находит вероятные несколько соответствий для 7 000 и проверяет свою производительность на обзоре COUP с точностью 95% без данных о положении.

arxiv arXiv cs.LG · 7 д назад

LOCUS: локальная коллекция законов для США

LOCUS предоставляет машинно-читаемый доступ к муниципальным и округовым постановлениям США, охватывающим 9239 городов и округов. В нём содержится слой, синхронизированный по округам, для 2309 из 3144 округов США, охватывающих большинство населения. Корпус, построенный с использованием распознавания печатных символов и метаданных, позволяет проводить исследования по правовой неясности и патернализму с использованием моделей на базе ModernBERT.

arxiv arXiv cs.AI · 7 д назад

XGBoost-Forget для машинного забвения в системах обнаружения сетевых инцидентов

XGBoost-Forget обеспечивает эффективное машинное забвение для моделей XGBoost на табличных сетевых данных об инцидентах. Оно сохраняет производительность модели, при этом обеспечивает более быстрое забвение по сравнению с полным переобучением, решая пробел в исследованиях машинного забвения для табличных данных в системах обнаружения сетевых инцидентов.

arxiv arXiv cs.AI · 7 д назад

Классификация связывает потребности присматривающих с технологиями в области психического здоровья

Новая классификация связывает психическое здоровье присматривающих при болезни Альцгеймера и деменции с технологическими вмешательствами. Она выявляет пробелы в поддержке таких вопросов, как напряжение в отношениях и выгорание сострадания, и предлагает общую рамку для проектирования технологий, ориентированных на человека и основанных на клинических данных.