Тема · Training data
arxiv arXiv cs.AI · 10 д назад

FusionRS: Первый масштабный датасет RGB-инфракрасного дистанционного зондирования

FusionRS представляет первый масштабный датасет RGB-инфракрасно-текстового типа для моделирования визуально-языковых моделей дистанционного зондирования. Он синхронизирует RGB и инфракрасные изображения с инфракрасно-осознанными описаниями, позволяя использовать двумодальные визуально-языковые основные модели. Эксперименты показывают улучшение синхронизации RGB-инфракрасных изображений, поиска и описания, при этом исследования с устранением факторов подтверждают критическую роль модальности-специфического текстового надзора.

arxiv arXiv cs.AI · 10 д назад

Опубликовано множество данных IMPACTeen в английской и польской версиях

IMPACTeen — это набор из 1021 текста, аннотированный с пяти сторон — подростков, родителей, психологов, экспертов по коммуникации и учителей. В него входят 5100 записей аннотаций, охватывающих социальные методы влияния, намерения, последствия и сопротивление, с аннотациями, проверенными через ручную редакцию. Набор данных, созданный с использованием генерации LLM и ручной проверки, доступен на английском и польском языках и поддерживает исследования в области социального влияния и обучения языковых моделей.

arxiv arXiv cs.AI · 10 д назад

Текстовые отзывы имеют ограниченное влияние в рекомендательных моделях

Исследование показывает, что хотя текстовые сигналы отзывов могут быть объединены с коллаборативными данными, их междусобные вклады остаются ограниченными по сравнению с коллаборативными сигналами в моделях факторизации матриц. Адаптивное объединение и механизмы межвекторного внимания улучшают гибкость представлений, но не значительно повышают производительность на различных наборах данных.

arxiv arXiv cs.LG · 10 д назад

Статистическая упрощение разделяет инференс от обновления состояния

Новая методика разделяет инференс в машинном обучении от сохранения состояния в системах потока с использованием статистической упрощения. Она целенаправленно инициирует долговременные обновления состояния на основе информативности событий, снижая нагрузку на путь сохранения на 90% без ущерба для полезности в последующих этапах или введения системных ошибок.

arxiv arXiv cs.LG · 10 д назад

Математический обзор анализа пространства форм в машинном обучении

Настоящий обзор представляет математическую структуру для анализа геометрических данных, объединяющую дифференциальную геометрию, статистику и машинное обучение. В нем описывается единый поток для представления форм, геодезических метрик, статистического анализа и обучения с геометрическим учетом, позволяющий изучать вариабельность форм и структурные траектории в популяциях и во времени. Применения охватывают биологию, медицину, антропологию и компьютерное зрение, подчеркивая трудности в обработке нелинейных и несогласованных геометрических вариаций.