Все статьи — korshunov.ai

Все статьи Страница 1 / 121

Двойной GPU: Параллелизм важнее размера модели для локальных LLM

Автор утверждает, что переход с одного на два GPU приносит большую пользу за счет параллельной обработки, а не благодаря возможности использовать более крупные и качественные квантованные модели. Для задач программирования разница в качестве между квантованием Q4 и Q6/Q8 минимальна, поэтому увеличение контекстного окна и пропускной способности становится более ценным.

media r/LocalLLaMA · 8 ч назад

Влияние GLM 5.2 !!

Пользователь Reddit разместил изображение с заголовком «Влияние GLM 5.2 !!» в сабреддите r/LocalLLaMA.

media r/LocalLLaMA · 8 ч назад

Предложение единого открытого датасета вместо децентрализованного обучения LLM

Автор утверждает, что сообщество с открытым исходным кодом должно приоритизировать создание массивного высококачественного датасета для предварительного обучения, а не пытаться координировать децентрализованное обучение LLM на домашних GPU. Этот сдвиг представлен как более практичный и немедленный ответ на недавние правительственные запреты на коммерческие фронтьерные модели и нехватку релизов открытых весов малого и среднего размера.

media r/LocalLLaMA · 8 ч назад

GPU Bolt Graphics будет оснащен двумя слотами DDR5 для ноутбуков

Bolt Graphics разрабатывает GPU, включающий два слота DDR5 SODIMM для памяти переполнения, с целью начать полное производство к Рождеству 2027 года. У компании есть работающие прототипы, и она нацелена на создателей контента как на первоначальную аудиторию.

arxiv arXiv cs.AI · 9 ч назад

Прогнозирование прогрессирования болезни Альцгеймера с учетом неопределенности на основе глубокого обучения

В данном исследовании предлагается вероятностная модель для лонгитюдного моделирования прогрессирования болезни Альцгеймера, которая объединяет предсказание порядкового диагноза, генерацию траекторий с несколькими горизонтами и декомпозицию оценки неопределенности. Подход использует кодировщик Temporal Fusion Transformer и авторегрессионную смесевую плотностную сеть (Mixture Density Network) для генерации вероятностных траекторий на пять лет вперед, одновременно оценивая как алеаторную, так и эпистемическую неопределенность.

arxiv arXiv cs.AI · 9 ч назад

ScaleToT: Обобщение структурированного рассуждения LLM для моделирования пользователей с низкой активностью в масштабе миллиардов

В статье представлена методика ScaleToT, которая обучается структурированному рассуждению на небольшой подвыборке пользователей и распространяет его на миллиарды пользователей с низкой активностью и разреженными профилями. Она объединяет уточнение Tree-of-Thought (ToT) с ограниченной энтропией, управляемое направляющей функцией, с обучением с учителем (SFT) и оптимизацией политики вознаграждения для передачи способностей к рассуждению без полного вывода LLM.

arxiv arXiv cs.AI · 9 ч назад

Абстракции запросов в доступе к данным на основе онтологий

В этой статье рассматривается абстракция запросов в доступе к данным на основе онтологий (OBDA) путем преобразования запросов к данным на уровень онтологии с использованием экзистенциальных правил и семантики определенных ответов.

arxiv arXiv cs.AI · 9 ч назад

Когда КВ дают сбой: проблемы верификации КВ с помощью OE-Assist

В данной статье исследуются проблемы верификации компетентностных вопросов (КВ) — процесса, при котором онтологии оцениваются на основе вопросов на естественном языке для обеспечения корректности моделирования. Авторы анализируют причины усложнения КВ и то, как ассистент на базе LLM может поддерживать пользователей в ходе этой оценки.

arxiv arXiv cs.AI · 9 ч назад

Инфинитезимальная причинность

В этой статье предлагается категориальный подход к инфинитезимальной причинности в категориях Маркова с алгеброй Фробениуса, оснащённых семантикой касательного расслоения. Вводится понятие достаточности причинности через совместимость двух различных структур Фробениуса: одна кодирует классические операции с переменными, а другая представляет геометрическую интегрируемость.

arxiv arXiv cs.AI · 9 ч назад

Themis: Объяснимая платформа на базе ИИ для обучения с подкреплением по отзывам человека

Авторы представляют Themis, платформу тестирования и оценки на основе объяснимого ИИ (XAI), которая сочетает прозрачность через объяснимость с выравниванием посредством отзывов человека для безопасных систем обучения с подкреплением.

arxiv arXiv cs.AI · 9 ч назад

Сохранение конфиденциальности в RAG с помощью многоагентной семантической переформулировки

Авторы предлагают многоагентную архитектуру, которая очищает извлеченный контент в системах Retrieval-Augmented Generation (RAG) посредством семантической переформулировки для предотвращения утечки конфиденциальных данных из вредоносных запросов. Используя три специализированных агента для извлечения конфиденциальной информации, семантического анализа и реконструкции, подход удаляет чувствительные идентификаторы, сохраняя основной смысл текста.

arxiv arXiv cs.AI · 9 ч назад

SAFARI: Масштабирование атрибуции сбоев агентов на длинных горизонтах через активное расследование

Статья представляет SAFARI, фреймворк, предназначенный для диагностики сбоев автономных агентов путем замены линейной загрузки контекста на диагностический цикл с расширенными инструментами. Этот подход отделяет точность диагностики от архитектурных ограничений контекста за счет использования специализированных инструментов и кратковременной памяти для анализа сегментов траектории.

arxiv arXiv cs.AI · 9 ч назад

Визуализация «Мы, народ»: преодоление разрыва в восприятии через плюралистическое повествование на основе данных

В данной статье рассматривается, как целенаправленные плюралистические дизайнерские решения в цифровых платформах с поддержкой ИИ могут создавать визуализации, подчеркивающие нюансы и общие черты между группами, тем самым снижая политическую поляризацию. Особое внимание уделяется конкретной инициативе в области технологий для обсуждений, которая отображает многомерные пространства мнений, выявляя области как консенсуса, так и разногласий среди разнообразных групп населения.

media r/LocalLLaMA · 9 ч назад

Локальные развертывания Mellum2

JetBrains открыла исходный код моделей Mellum2, серии LLM объемом 12B-2.5A, обученных с нуля для обеспечения быстрого вывода на аппаратном обеспечении H100/H200, а также для локальных развертываний.

arxiv arXiv cs.AI · 10 ч назад

CineCap: Структурированное рассуждение с пространственно-временными якорями для кинематографического описания видео

Исследователи предлагают CineCap, фреймворк, который объединяет структурированное рассуждение с пространственно-временными якорями и обучением с подкреплением для улучшения кинематографического описания видео. Метод связывает профессиональные описания на языке кино с явными визуальными доказательствами, балансируя между полнотой описания и фактической точностью.

media AI News (smol.ai) · 10 ч назад

Anthropic запускает Claude Tag, асинхронный инструмент делегирования задач для Slack

Anthropic запустила Claude Tag, новую функцию рабочего процесса, которая позволяет командам делегировать задачи Claude асинхронно в рамках Slack. Позиционируемая как переход от чата с одним пользователем к командному взаимодействию, эта функция позволяет Claude присоединиться к команде в качестве участника с доступом к выбранным каналам, инструментам и кодовым базам.

lab NVIDIA Technical Blog · 10 ч назад

Максимизация энергоэффективности ИИ-фабрики за счёт оптимизации вывода и обучения на всех уровнях стека

Потребление энергии составляет 40% операционных расходов (OpEx) на работу ИИ-фабрики, а производительность на ватт становится критическим показателем эффективности, напрямую влияющим на стоимость токенов.

media r/LocalLLaMA · 10 ч назад

Создание веб-слоя доступа для локальных AI-агентов

Разработчик делится опытом создания централизованного веб-слоя доступа для управления взаимодействиями между локальными AI-моделями и внешними сервисами. Этот подход решает проблему поддержки множества отдельных интеграций для каждого нового проекта с агентом.

media r/LocalLLaMA · 10 ч назад

NASA тестирует локальный вывод LLM для будущих космических миссий

Исследователи Red Hat и NASA разрабатывают Цифрового Ассистента Врача Экипажа (CMO-DA), медицинскую ИИ-систему, которая запускает большие языковые модели на локальном оборудовании без зависимости от облака. Эта инициатива решает проблему непрактичности наземного телемедицинского обслуживания для астронавтов в миссиях к Луне или Марсу из-за задержки сигнала и перебоев связи.

media r/LocalLLaMA · 10 ч назад

Настройка H200 NVL на потребительском (почти) оборудовании

Пользователь успешно настроил GPU NVIDIA H200 NVL на рабочей станции, собранной на базе материнской платы ASUS WRX90E-SAGE SE и 64-ядерного процессора Threadripper, продемонстрировав, что высокопроизводительные AI-ускорители могут работать на не серверном оборудовании.