Research paper
arxiv arXiv cs.LG · 6 д назад

Эффективная размерность определяет обобщение в квантовых моделях зрения

Квантовые модели зрения демонстрируют лучшее обобщение при большем запутывании или квантовом шуме, явления, объединяющиеся через эффективную размерность квантового ядра признаков, формирующегося под действием шума. Эта размерность выступает в качестве механизма регуляризации в режимах переобучения, при амплитудном затухании тестовая точность улучшается на до 13% вдоль инвертированного-U оптимального диапазона.

arxiv arXiv cs.LG · 6 д назад

Обнаружение смещения концепций на основе обучаемых моделей: анализ и оценка

Этот исследовательский проект анализирует и оценивает алгоритмы обнаружения смещения концепций в нескольких категориях с использованием синтетических и реальных потоковых данных. В нем рассматриваются характеристики смещения и оцениваются показатели работы детекторов в условиях резких и постепенных смещений, чтобы улучшить понимание поведения смещения и применимости детекторов.

arxiv arXiv cs.LG · 6 д назад

QCPIKAN: квантово-классическая физически-обусловленная сеть Кольмогорова-Арнольда для уравнений в частных производных

QCPIKAN — первая квантово-классическая физически-обусловленная сеть Кольмогорова-Арнольда, разработанная для решения уравнений в частных производных. Она использует слои на основе чебышёвских полиномов КАН и параметризованных квантовых схем для встраивания физических ограничений в процесс обучения, обеспечивая экспоненциальное сходимость ошибки и снижение численной дисперсии. Проверена на сценариях проникновения в пористых средах, она превосходит существующие квантово-классические нейронные сети по точности предсказания, контролю ошибки и динамическому отслеживанию.

arxiv arXiv cs.CL · 6 д назад

Введение P-CHR AUC и CRR для семантической кэширования

Мы вводим метрики Точность-Кэш-Хит-Рейт (P-CHR) AUC и Калибровочная устойчивость (CRR), чтобы решить разрыв калибровки в семантическом кэшировании. Эти метрики оценивают точность на разных уровнях использования кэша и измеряют, насколько качество ранжирования в открытом режиме сохраняется при развертывании. Анализ показывает, что разрыв обусловлен тренировочными целями, а не масштабом данных, и пост-хай-калибровка лишь частично решает эту проблему.

arxiv arXiv cs.CL · 6 д назад

Фреймворк мультиагентной транзакционной памяти

Фреймворк мультиагентной транзакционной памяти (MATM) обеспечивает хранение и извлечение траекторий, сгенерированных агентами на уровне популяции. Он позволяет производящим агентам делиться процедурными знаниями с потребляющими агентами, что улучшает выполнение задач и снижает количество шагов взаимодействия в интерактивных средах, таких как ALFWorld и WebArena, без координации или совместной тренировки.

arxiv arXiv cs.CL · 6 д назад

Стабилизация намерения инструмента в потоковом RAG

Исследование оценивает стабилизацию намерения инструмента в потоковом RAG, определяя момент, когда спекулятивные запросы на инструменты сходятся к правильным ответам. На бенчмарке CRAG 73,9% запросов позволяют значительное скрытие задержки, при этом ранняя стабилизация наблюдается в вопросах с прямым извлекаемым доказательством. Тип вопроса значительно предсказывает раннюю или позднюю стабилизацию, что позволяет определить, когда спекулятивные триггеры оказываются эффективными.

arxiv arXiv cs.CL · 6 д назад

PASQA: модель оценки качества речи с фокусом на интонационных акцентах

PASQA — это модель оценки качества речи, предназначенная для оценки правильности интонационных акцентов в синтезированной японской речи. Она использует набор данных с контролируемыми ошибками акцентов и включает в себя саморегулирующее обучение, синтез с учетом моры, потери ранжирования и локализацию ошибок акцентов, чтобы обеспечить высокую точность обнаружения ошибок акцентов у разных говорящих, превосходя традиционные модели по согласованию с человеческими оценками.

arxiv arXiv cs.CL · 7 д назад

Техники оптимизации инференса, ориентированные на токены

В этой статье представлено четырехуровневое техническое архитектурное решение для оптимизации инференса, ориентированного на токены, включающее Мульти-модельное объединение, Оптимизацию модели, Сочетание вычислений и модели и Сочетание вычислений, сети и модели. В статье рассматриваются ключевые технологии и состояние отрасли, анализируются их практическая ценность в сокращении затрат на токены, повышении эффективности сервиса и обеспечении стабильного поставки токенов.

arxiv arXiv cs.CL · 7 д назад

CATCH-ME, если вы RAG: Мультимедийный датасет для противодействия ненависти и недостоверной информации

CATCH-ME представляет первый масштабный мультимедийный датасет контекстуально аннотированных мульти-переводных диалогов противодействия ненависти и недостоверной информации. Датасет охватывает пять языков и сосредоточен на семи маргинализированных группах, диалоги основаны на проверенных источниках фактической проверки и включают аннотации на уровне документов и фрагментов для систем RAG.

arxiv arXiv cs.LG · 7 д назад

Перекрестная оценка AUC для оценки реалистичного детектора фейков

Новый метрика, перекрестная оценка AUC (Cross-AUC), решает недостатки традиционной оценки AUC, средняя по доменам AUC и включает поляризацию предсказаний через расстояние Вассерштейна. Она лучше отражает реальную производительность при сдвигах доменов и предоставляет интерпретируемые данные о деградации детектора.

arxiv arXiv cs.LG · 7 д назад

XGBoost-Forget для машинного забвения в обнаружении сетевых инцидентов

XGBoost-Forget обеспечивает эффективное машинное забвение для моделей XGBoost на табличных сетевых данных об инцидентах. Оно сохраняет производительность модели, при этом обеспечивает более быстрое забвение по сравнению с полным переобучением, решая пробел в исследованиях машинного забвения для табличных данных в обнаружении сетевых инцидентов.

arxiv arXiv cs.LG · 7 д назад

Каталог Chandra-Gaia использует машинное обучение для разрешения соответствий между источниками рентгеновского и оптического излучения

Машинный интеллект разрешает неопределённые соответствия между источниками рентгеновского излучения Chandra и оптического излучения Gaia, используя данные о яркости, цвете и расстоянии. Он идентифицирует соответствия для 113 000 из 254 000 источников Chandra, находит вероятные несколько соответствий для 7 000 и проверяет свою производительность на обзоре COUP с точностью 95% без данных о положении.

arxiv arXiv cs.LG · 7 д назад

LOCUS: локальная коллекция законов для США

LOCUS предоставляет машинно-читаемый доступ к муниципальным и округовым постановлениям США, охватывающим 9239 городов и округов. В нём содержится слой, синхронизированный по округам, для 2309 из 3144 округов США, охватывающих большинство населения. Корпус, построенный с использованием распознавания печатных символов и метаданных, позволяет проводить исследования по правовой неясности и патернализму с использованием моделей на базе ModernBERT.

arxiv arXiv cs.AI · 7 д назад

XGBoost-Forget для машинного забвения в системах обнаружения сетевых инцидентов

XGBoost-Forget обеспечивает эффективное машинное забвение для моделей XGBoost на табличных сетевых данных об инцидентах. Оно сохраняет производительность модели, при этом обеспечивает более быстрое забвение по сравнению с полным переобучением, решая пробел в исследованиях машинного забвения для табличных данных в системах обнаружения сетевых инцидентов.

arxiv arXiv cs.AI · 7 д назад

Классификация связывает потребности присматривающих с технологиями в области психического здоровья

Новая классификация связывает психическое здоровье присматривающих при болезни Альцгеймера и деменции с технологическими вмешательствами. Она выявляет пробелы в поддержке таких вопросов, как напряжение в отношениях и выгорание сострадания, и предлагает общую рамку для проектирования технологий, ориентированных на человека и основанных на клинических данных.

arxiv arXiv cs.CL · 7 д назад

Dango: строго однолингвальный LLM для исследований SLA

Dango — это LLM с 1,8 миллиарда параметров, разработанный для изучения второго языкового приобретения на японском языке в английском. Он использует метод фильтрации для минимизации английской контаминации в монолингвальной предобученной фазе, сохраняя реалистичное воздействие первого языка. После тонкой настройки на уроки, сгенерированные LLM, Dango создает человечески естественные выводы на втором языке, превосходя нефильтрованные и стандартные многолингвальные модели.

arxiv arXiv cs.CL · 7 д назад

LOCUS: локальная корпорация нормативных актов для Соединенных Штатов

LOCUS предоставляет машинно-читаемый доступ к почти всем публично доступным нормативным актам муниципальных и городских органов США, охватывая 9239 городов и округов. В нем включена гармонизированная доступная слоистая структура для 2309 из 3144 округов США, охватывающих большинство населения. Корпора, построенная с использованием распознавания печатных символов и метаданных для воспроизводимости, позволяет проводить масштабный анализ местного законодательства, включая такие параметры, как прозрачность и патернализм, с использованием моделей на базе ModernBERT.

arxiv arXiv cs.LG · 7 д назад

Обнаружение структурных искажений через сдвиги причинных механизмов

Эта статья представляет алгоритм StruBI, который выявляет скрытые смещения из-за конфликтов и выбора путем анализа сдвигов причинных механизмов в различных средах. Алгоритм формализует критерий на основе мутуальной информации для обнаружения структурных искажений и демонстрирует превосходную производительность при восстановлении искаженных переменных на синтетических и реальных данных.

arxiv arXiv cs.LG · 7 д назад

Расширение системы аварийного торможения с использованием неприменяемых данных через мета-обратную связь в полуосуществленном обучении

Мета-обратная связь в полуосуществленном обучении позволяет масштабировать систему автоматического аварийного торможения с использованием огромных объемов неприменяемых данных из автопарков. Устойчивый подход снижает ошибки псевдометок и подавляет риски гиперболизации, обеспечивая соотношение 100:1 между положительными и ложными активациями и на 35% больше километров безаварийного вождения по сравнению с базовым вариантом на основе правил в реальных условиях эксплуатации.

arxiv arXiv cs.LG · 7 д назад

Нейронные сети с учетом сдвига домена для оценки несбалансированной массы

Предлагается нейронная сеть с учетом сдвига домена для оценки несбалансированных масс на вращающихся шпиналях при изменяющихся режимах работы. Модель использует максимальное среднее отклонение для синхронизации представлений признаков между различными операционными доменами, повышая точность прогноза при том, что поведение системы отличается от условий обучения. Результаты показывают ее эффективность в приложениях мониторинга состояния конструкций, где сдвиги доменов неизвестны или не учитываются.