Research paper — korshunov.ai

Research paper Страница 1 / 16

Несоответствие обучения с помощью противоречивых данных для нелинейных моделей

Формальное доказательство показывает, что между риском противоречивого обучения и риском регуляризации в двухслойных сетях не существует эквивалентности. Эмпирические результаты на Wide-ResNets подтверждают, что эта невозможность сохраняется в более глубоких и более выразительных архитектурах.

arxiv arXiv cs.LG · 23 ч назад

Машинное обучение предсказывает высокорисковые полипы кишечника у афроамериканцев

Модель машинного обучения, разработанная на основе клинических данных до колоноскопии, предсказывает высокорисковые полипы кишечника у афроамериканцев. Модель, подтвержденная в разнообразной городской группе, использует демографические, образовательные и данные о сопутствующих заболеваниях для выявления пациентов с повышенным риском, с внешней валидацией, проведенной в 2023-2024 годах.

arxiv arXiv cs.LG · 23 ч назад

JS-Разделение повышает автокорреляционную синхронизацию текста и изображения в GRPO

Исследование вводит JS-разделение в автокорреляционную синхронизацию текста и изображения в стиле GRPO, демонстрируя его эффективность в балансировке оптимизации политики и разнообразия генерации. Эксперименты на LlamaGen и Janus-7B показывают, что JS-разделение достигает лучших или конкурентоспособных результатов по всем метрикам, сохраняя разнообразные выводы.

arxiv arXiv cs.LG · 23 ч назад

Глубокое обучение с параллельной временной сложностью O(log N)

Гиерархическое блочное локальное обучение (HBLL) позволяет обучать глубокие нейронные сети за временной сложностью O(log N) в параллельном режиме, устраняя необходимость полного обратного распространения. HBLL разбивает сети на гиерархически связанные блоки и достигает конкурентоспособных результатов на задачах визуального и языкового понимания, с расширениями на рекуррентные архитектуры.

arxiv arXiv cs.LG · 23 ч назад

Анонимизированное распределенное обучение временных графов для кибер-устойчивых систем Интернета вещей

В статье представлено распределенное решение TGCN-A2C, обеспечивающее 99,48% и 99,61% точности на тестовых данных CICDDoS 2019 и TON-IoT, превосходя Fed-Inforce-Fusion на 0,21 процентный пункт. Включает обнаружение аномалий, оценку на основе цифрового двойника, адаптивный выбор действий и улучшенный слой ловушек, при этом все основные классы атак достигают значений F1 выше 0,92 и 0.94 соответственно, и обеспечивает пост-объяснение с помощью SHAP, LIME, Grad-CAM и анализа контрапримеров.

Несоответствие обучения с помощью противоречивых данных для нелинейных моделей

Машинное обучение предсказывает высокорисковые полипы кишечника у афроамериканцев

JS-Разделение повышает автокорреляционную синхронизацию текста и изображения в GRPO

Глубокое обучение с параллельной временной сложностью O(log N)

Анонимизированное распределенное обучение временных графов для кибер-устойчивых систем Интернета вещей

Исследование психических моделей пользователей в переводе речи

AI-PAVE-Br: LLM-Base PAVE для бразильского электронного коммерции

DREAM: авторегрессивное обучение для плотных векторов поиска

CANDLE: Легкая дедупликация шумов на арабском языке с использованием CTC

Рынки микро-транзакций для проверенной информации о продуктах в агентной электронной коммерции

L3Cube-MahaPOS: датасет маратхи и модели BERT

Выбор обучающих данных с учетом качества для научного синтеза

Лингвистические отпечатки раскрывают региональные происхождения таньских поэтов

Первый масштабный анализ сетей совместного появления алгоритмов

PORTER: Языково-обоснованные представления событий для портативных фундаментальных моделей электронных медицинских записей

Ошибки калибровки LoRA Monitor при использовании Top-1 в диффузионных языковых моделях

Целостный планировщик данных для предобучения языковых моделей с использованием многокритериального обучения с помощью реверсного обучения

InterAligner: прогрессивная синхронизация для аудио-распознавания

BehaviorBench запускает бенчмарк для поведенческих ИИ-моделей

CORE-BREW: мягкий декодинг на основе лог-вероятностных отношений для устойчивой многоразрядной вставки водяных знаков в LLM