Research paper — korshunov.ai

Research paper Страница 1 / 19

XGBoost-Forget для машинного забвения в обнаружении сетевых инцидентов

XGBoost-Forget обеспечивает эффективное машинное забвение для моделей XGBoost на табличных сетевых данных об инцидентах. Оно сохраняет производительность модели, при этом обеспечивает более быстрое забвение по сравнению с полным переобучением, решая пробел в исследованиях машинного забвения для табличных данных в обнаружении сетевых инцидентов.

arxiv arXiv cs.LG · 7 д назад

Каталог Chandra-Gaia использует машинное обучение для разрешения соответствий между источниками рентгеновского и оптического излучения

Машинный интеллект разрешает неопределённые соответствия между источниками рентгеновского излучения Chandra и оптического излучения Gaia, используя данные о яркости, цвете и расстоянии. Он идентифицирует соответствия для 113 000 из 254 000 источников Chandra, находит вероятные несколько соответствий для 7 000 и проверяет свою производительность на обзоре COUP с точностью 95% без данных о положении.

arxiv arXiv cs.LG · 7 д назад

LOCUS: локальная коллекция законов для США

LOCUS предоставляет машинно-читаемый доступ к муниципальным и округовым постановлениям США, охватывающим 9239 городов и округов. В нём содержится слой, синхронизированный по округам, для 2309 из 3144 округов США, охватывающих большинство населения. Корпус, построенный с использованием распознавания печатных символов и метаданных, позволяет проводить исследования по правовой неясности и патернализму с использованием моделей на базе ModernBERT.

arxiv arXiv cs.AI · 7 д назад

XGBoost-Forget для машинного забвения в системах обнаружения сетевых инцидентов

XGBoost-Forget обеспечивает эффективное машинное забвение для моделей XGBoost на табличных сетевых данных об инцидентах. Оно сохраняет производительность модели, при этом обеспечивает более быстрое забвение по сравнению с полным переобучением, решая пробел в исследованиях машинного забвения для табличных данных в системах обнаружения сетевых инцидентов.

arxiv arXiv cs.AI · 7 д назад

Классификация связывает потребности присматривающих с технологиями в области психического здоровья

Новая классификация связывает психическое здоровье присматривающих при болезни Альцгеймера и деменции с технологическими вмешательствами. Она выявляет пробелы в поддержке таких вопросов, как напряжение в отношениях и выгорание сострадания, и предлагает общую рамку для проектирования технологий, ориентированных на человека и основанных на клинических данных.

arxiv arXiv cs.CL · 7 д назад

Dango: строго однолингвальный LLM для исследований SLA

Dango — это LLM с 1,8 миллиарда параметров, разработанный для изучения второго языкового приобретения на японском языке в английском. Он использует метод фильтрации для минимизации английской контаминации в монолингвальной предобученной фазе, сохраняя реалистичное воздействие первого языка. После тонкой настройки на уроки, сгенерированные LLM, Dango создает человечески естественные выводы на втором языке, превосходя нефильтрованные и стандартные многолингвальные модели.

arxiv arXiv cs.CL · 7 д назад

LOCUS: локальная корпорация нормативных актов для Соединенных Штатов

LOCUS предоставляет машинно-читаемый доступ к почти всем публично доступным нормативным актам муниципальных и городских органов США, охватывая 9239 городов и округов. В нем включена гармонизированная доступная слоистая структура для 2309 из 3144 округов США, охватывающих большинство населения. Корпора, построенная с использованием распознавания печатных символов и метаданных для воспроизводимости, позволяет проводить масштабный анализ местного законодательства, включая такие параметры, как прозрачность и патернализм, с использованием моделей на базе ModernBERT.

arxiv arXiv cs.LG · 7 д назад

Обнаружение структурных искажений через сдвиги причинных механизмов

Эта статья представляет алгоритм StruBI, который выявляет скрытые смещения из-за конфликтов и выбора путем анализа сдвигов причинных механизмов в различных средах. Алгоритм формализует критерий на основе мутуальной информации для обнаружения структурных искажений и демонстрирует превосходную производительность при восстановлении искаженных переменных на синтетических и реальных данных.

arxiv arXiv cs.LG · 7 д назад

Расширение системы аварийного торможения с использованием неприменяемых данных через мета-обратную связь в полуосуществленном обучении

Мета-обратная связь в полуосуществленном обучении позволяет масштабировать систему автоматического аварийного торможения с использованием огромных объемов неприменяемых данных из автопарков. Устойчивый подход снижает ошибки псевдометок и подавляет риски гиперболизации, обеспечивая соотношение 100:1 между положительными и ложными активациями и на 35% больше километров безаварийного вождения по сравнению с базовым вариантом на основе правил в реальных условиях эксплуатации.

arxiv arXiv cs.LG · 7 д назад

Нейронные сети с учетом сдвига домена для оценки несбалансированной массы

Предлагается нейронная сеть с учетом сдвига домена для оценки несбалансированных масс на вращающихся шпиналях при изменяющихся режимах работы. Модель использует максимальное среднее отклонение для синхронизации представлений признаков между различными операционными доменами, повышая точность прогноза при том, что поведение системы отличается от условий обучения. Результаты показывают ее эффективность в приложениях мониторинга состояния конструкций, где сдвиги доменов неизвестны или не учитываются.

arxiv arXiv cs.LG · 7 д назад

TransitNet достигает точности 95,2% при поиске транзитов в условиях низкого уровня шума

TransitNet, компактная система глубокого обучения с усилением внимания, достигает точности 95,2% при поиске транзитов в условиях низкого уровня шума, превосходя TLS и BLS по значениям ROC-AUC и PR-AP. Он восстанавливает 93,0% введённых транзитов размером Земли и подземных планет, 97,4% введённых транзитов полностью охвачены оцененными окнами транзитов, и успешно восстанавливает все 34 подтверждённых планет Кеплера с средней ошибкой в середине 1,24 часа.

arxiv arXiv cs.LG · 7 д назад

Нулевая активная акустическая получение признаков через эlicitацию LLM

Новый фреймворк позволяет осуществлять нулевое активное получение признаков, используя LLM для извлечения только дискриминативных статистик, таких как одиночные отклонения и парные ковариации. С помощью максимальной энтропийной закрытия решается неопределенность при выборе признаков и превосходит сам LLM, особенно в сложных случаях пациентов с ИБД, где уровень диагностической неопределенности высок.

arxiv arXiv cs.LG · 7 д назад

Квантовое расширение GAN не показывает преимуществ в МРТ мозга

Управляемый бенчмарк показывает отсутствие значимого роста производительности за счёт квантовых генеративных моделей при расширении МРТ мозга. Синтетические образцы, созданные квантовыми и классическими GAN-моделями, статистически не различимы, и обе модели демонстрируют коллапс моделей и образцы за пределами распределения, особенно при низких долях данных. Исследование заключает, что квантовое расширение не превосходит классические методы и действует скорее как регуляризация, чем как расширение данных.

arxiv arXiv cs.LG · 7 д назад

Устойчивый последовательный тест условной независимости

Новый метод вводит адаптивную ставку с керновыми статистиками для проверки условной независимости, снижая инфляцию ошибки первого рода из-за ошибки оценки. Он превосходит существующие последовательные подходы Model-X как в синтетических, так и в реальных задачах справедливости, сохраняя высокую мощность, при этом более устойчив к ошибкам оценки распределения.

arxiv arXiv cs.LG · 7 д назад

DIPHINE: Нейронный оценщик для $Φ$-ID в непрерывных системах

DIPHINE — первый нейронный оценщик, использующий модели диффузии на основе оценки для одновременной оценки всех взаимных информационных терминов, необходимых для интегрированного информационного разложения ($Φ$ID), из одного амортизированного сети. Он восстанавливает шестнадцать не пересекающихся информационных атомов с помощью инверсии Мёбиуса и предоставляет теоретический анализ, показывающий, что оценка синергии на синергию является самой сложной, с точными результатами на синтетических тестах и реальных биологических данных.

arxiv arXiv cs.LG · 7 д назад

Sumi: Открытая унифицированная модель распределенной генерации языка, построенная с нуля

Sumi — это модель распределенной генерации языка с 7 миллиардами параметров, предобученная с нуля на 1,5 трлн токенов. Она конкурирует с автокоррекционными моделями на задачах знаний, логики и программирования, но демонстрирует ухудшение на тестах по общеобразовательным знаниям, вероятно, из-за доминирования в обучающих данных образовательного контента. Веса модели, контрольные точки и полная схема обучения были опубликованы.

arxiv arXiv cs.LG · 7 д назад

Moat: Динамический анализ с учетом жизненного цикла для безопасной выполнения моделей машинного обучения

Moat — это подход динамического анализа, обеспечивающий безопасное выполнение моделей машинного обучения за счёт мониторинга взаимодействий с хост-системой в течение определённых фаз жизненного цикла модели. Реализация Re-Moat обнаруживает все рассмотренные классы атак с почти нулевым коэффициентом ложноположительных результатов при анализе 77 974 реальных моделей и нескольких фреймворков, превосходя существующие решения на основе статического сканирования моделей.

arxiv arXiv cs.LG · 7 д назад

Геометрический и стохастический анализ разрывов в разреженных моделях смеси экспертов

В этой статье анализируются разрывы в моделях разреженной смеси экспертов, классифицируются по порядку и показывается, что разрывы низкого порядка доминируют по объёму. Доказывается, что случайные входные пути почти наверное первоначально достигают разрыва первого порядка с вероятностными оценками конечного времени, и выводятся оценки времени пребывания для каждого порядка. Предлагается простой механизм сглаживания, который улучшает непрерывность и производительность модели с минимальными затратами вычислительных ресурсов.

arxiv arXiv cs.LG · 7 д назад

Обучение с положительными и непримечаемыми примерами для аудита оценки языковых моделей

Новый фреймворк использует обучение с положительными и непримечаемыми примерами и частичный оптимальный транспорт для аудита искажений в оценке языковых моделей. Он выравнивает положительные ответы, подтвержденные людьми, с ответами модели, не имеющими меток, в пространстве вложений, выявляя стабильные предпочтения людей и корректируя искажение избыточности без переобучения. Эксперименты показывают улучшенное соответствие с людьми, устойчивость к искажениям в представлении и интерпретируемость оценок уверенности.

arxiv arXiv cs.LG · 7 д назад

Оптимизация интервалов последующих визитов с учётом контекста для диабета 2 типа

Исследование использует контекстуальный марковский процесс принятия решений для оптимизации интервалов последующих визитов для пациентов с диабетом 2 типа на основе данных электронных медицинских записей 22 154 пациентов. Модель выявляет два клинических контекста — низкий и высокий риск — и рекомендует адаптивные интервалы: 1 месяц для неизмеренных лабораторных показателей, до 3 месяцев для повышенных значений или госпитализаций, и 6–12 месяцев для стабильного контроля, при этом интервалы для пациентов с высоким риском короче. Политики CMDP сократили ожидаемые накопленные расходы на 34,8% в контексте высокой сопутствующей патологии и на 6,4% в контексте низкой сопутствующей патологии по сравнению с политикой с фиксированным интервалом.