Все статьи — korshunov.ai

Все статьи Страница 1 / 119

video-SALMONN-R3: Эффективное понимание видео с помощью обучения с подкреплением

В статье представлен video-SALMONN-R$^3$, сквозная большая языковая модель для видео, которая обеспечивает эффективное повторное просмотр сегментов видео с использованием обучения с подкреплением без опоры на данные цепочки рассуждений (chain-of-thought). Этот подход решает проблемы вычислительных ограничений и ограничений памяти, которые обычно заставляют модели использовать пониженную частоту кадров и пространственное разрешение.

arxiv arXiv cs.AI · 3 ч назад

Адаптивная система машинного обучения для оптимизации траекторий БПЛА в O-RAN

В данной статье представлен новый подход к оптимизации траекторий беспилотных летательных аппаратов (БПЛА) в сотовых системах 6G за счет интеграции улучшенного непрерывного трансферного обучения в архитектуру O-RAN. Система использует библиотеку предварительно обученных моделей и механизм выбора для минимизации времени адаптации при работе в динамичной среде.

arxiv arXiv cs.AI · 3 ч назад

RetiSEM: Обобщение каузальных моделей для фрагментированных биомедицинских данных

Авторы предлагают RetiSEM — фреймворк структурного уравнения моделирования с ограничениями по домену, предназначенный для восстановления каузальных графов и проведения медиационного анализа на основе фрагментированных биомедицинских данных с ограниченными мультимодальными ресурсами. Метод организует переменные в блоки, информированные биологией, и применяет ограничения на запрещённые рёбра для декомпозиции эффектов на уровне путей.

arxiv arXiv cs.AI · 3 ч назад

Краснокомандная проверка агентных систем

В данной работе представлен первый глубокий анализ безопасности широко используемых агентных систем для операций наступательной кибербезопасности, выявляющий общие архитектурные недостатки, позволяющие злоумышленникам эксфильтровать API-ключи и компрометировать машины операторов даже внутри песочниц.

arxiv arXiv cs.AI · 3 ч назад

CrossPool: Эффективная совместная работа нескольких LLM для холодных моделей MoE за счёт разделения пулов весов и KV-кэша

CrossPool — это движок обслуживания, предназначенный для холодных моделей Mixture-of-Experts (MoE), который разделяет веса FFN и KV-кэш на отдельные пулы памяти GPU для устранения неэффективности использования памяти в сценариях разреженных запросов. За счёт консолидации статических весов и динамического выделения ресурсов под активный спрос на KV-кэш система стремится повысить утилизацию памяти GPU и поддерживать всплесковые запросы с длинным контекстом.

media r/LocalLLaMA · 3 ч назад

Модель HuiHui с удалёнными ограничениями превосходит базовую 3.6-35B-a3b в задачах по математике и коду

Специальный рецепт квантования, применённый к модели HuiHui с удалёнными ограничениями, демонстрирует превосходные результаты по сравнению с базовой версией 3.6-35B-a3b в задачах математики и программирования. Результаты указывают на то, что удаление механизмов отказа позволяет модели достигать большей точности и мудрости в этих областях.

media r/LocalLLaMA · 3 ч назад

Амоди: «Модели с открытым исходным кодом съедят ваших детей»

Этот пост на Reddit содержит изображение с цитатой «Модели с открытым исходным кодом съедят ваших детей», приписываемой Амоди. Содержание включает ссылку на изображение и ссылку на связанную ветку комментариев в r/LocalLLaMA.

media r/LocalLLaMA · 3 ч назад

Амодеи из Anthropic: открытые модели могут быть опасными

Дарио Амодеи, генеральный директор Anthropic, выразил обеспокоенность тем, что открытые ИИ-модели могут привести к опасным последствиям. В заявлении подчеркиваются потенциальные риски, связанные с неограниченным доступом к передовым технологиям искусственного интеллекта.

arxiv arXiv cs.AI · 4 ч назад

О малости показателей масштабирования больших языковых моделей

В статье обсуждаются причины, по которым показатели масштабирования современных приложений на основе больших языковых моделей указывают на неустойчивый режим с точки зрения энергоресурсов.

arxiv arXiv cs.AI · 4 ч назад

Справедливая оценка графовых фундаментальных моделей для предсказания свойств узлов

В данном исследовании проводится тщательная переоценка девяти недавних графовых фундаментальных моделей (GFMs) для предсказания свойств узлов, сравнивая их с сильными базовыми моделями графовых нейронных сетей (GNN), чтобы устранить отсутствие единых стандартов оценки в этой области.

arxiv arXiv cs.AI · 4 ч назад

RaDaR: специализированная LLM для рассуждений, ускоряющая диагностику редких заболеваний

Исследователи представляют RaDaR — открытую 32B параметр reasoning large language model, предназначенную для ускорения диагностики редких заболеваний за счет решения проблем клинической внедряемости и нехватки данных. Модель обучена на почти 50 000 публичных случаях и более чем 100 000 синтетических случаев, демонстрируя превосходные результаты по бенчмаркам и во внешних валидационных центрах.

arxiv arXiv cs.AI · 4 ч назад

Обучение с подкреплением для агентов управления компьютером с автономной оценкой

Авторы предлагают фреймворк тонкой настройки на основе обучения с подкреплением, который использует автономную оценку на основе зрительно-языковых моделей в качестве масштабируемого сигнала надзора для агентов графического интерфейса, устраняя необходимость в ручных метках или эвристиках, специфичных для задач. Рассматривая обратную связь от оценщика как зашумленный бинарный канал вознаграждения и выводя оценщик с коррекцией шума для Proximal Policy Optimization, метод решает проблему получения машиночитаемых вознаграждений в открытых настольных средах.

arxiv arXiv cs.AI · 4 ч назад

AdversaBench: Автоматизированное красное тестирование LLM с подтверждением многосудейской панели и переносимостью между моделями

Авторы представляют AdversaBench, конвейер красного тестирования от начала до конца, который генерирует сложные входные данные для больших языковых моделей с использованием пяти структурированных операторов мутации и подтверждает сбои через трехсудейскую панель с судьей-арбитром.

media r/LocalLLaMA · 4 ч назад

Samsung, SK hynix и Micron стали ответчиками в США по делу о сговоре о ценах на память

В Соединенных Штатах подан иск против крупных производителей чипов памяти Samsung, SK hynix и Micron в связи с обвинениями в сговоре о ценах.

blog Simon Willison · 4 ч назад

Ornith-1.0: Самоструктурирующиеся LLM для агентного программирования

DeepReinforce выпустила Ornith-1.0, модель с открытыми весами под лицензией MIT, которая демонстрирует лучшие результаты среди моделей с открытым исходным кодом сопоставимого размера на бенчмарках по программированию. Модель построена на базе предварительно обученных Gemma 4 и Qwen 3.5 и включает варианты с количеством параметров: 9B Dense, 31B Dense, 35B MoE и 397B MoE.

media r/LocalLLaMA · 4 ч назад

Статья на arXiv задержана на 2 месяца.

Исследователь, подающий свою первую статью в arXiv, сообщает, что рукопись находится на рассмотрении модераторов уже два месяца, несмотря на прохождение автоматических проверок квалификации. Автор спрашивает, является ли такая задержка нормальной, и просит совета: стоит ли подавать работу повторно или продолжать ждать.

github llama.cpp · 4 ч назад

Выпуск llama.cpp b9842: дедупликация пресетов и кэшированных записей моделей в /v1/models

Выпуск llama.cpp b9842 вносит изменения для дедупликации пресетов и кэшированных записей моделей в эндпоинте /v1/models. Это обновление одобрено Адриеном Галлуэтом из Hugging Face.

arxiv arXiv cs.AI · 5 ч назад

Постер: Исследование пределов обнаружения турецких телефонных мошеннических звонков на основе аудио

Данное исследование изучает использование больших языковых моделей для обнаружения мошеннических телефонных звонков на турецком языке — языке с низким уровнем ресурсности, где аннотированные данные отсутствуют.

arxiv arXiv cs.AI · 5 ч назад

Управляемая разделяемая память для многоагентных LLM-систем

В данной работе формализуется проблема fleet-memory в средах с множеством агентов на базе LLM, выделяются четыре фундаментальных режима отказа: несанкционированная утечка, распространение устаревших данных, персистентность противоречий и коллапс происхождения. Для решения этих проблем авторы определяют явные примитивы системного уровня, включая ограниченный поиск, временное замещение, отслеживание происхождения и управление распространением памяти на основе политик.

arxiv arXiv cs.AI · 5 ч назад

Квантовая конвергенция: соединение классического стоимостного инвестирования и современных факторных моделей

Это исследование проверяет, могут ли классические правила стоимостного инвестирования Бенджамина Грэма действовать как математический фильтр для предотвращения запоминания рыночного шума сложными моделями машинного обучения. В исследовании сравниваются чистые правила Грэма, современные факторы и их комбинация с моделями XGBoost и AutoGluon на основе 20-летних данных индекса S&P 500.