Все статьи
arxiv arXiv cs.AI · 8 ч назад

CineCap: Структурированное рассуждение с пространственно-временными якорями для кинематографического описания видео

Исследователи предлагают CineCap, фреймворк, который объединяет структурированное рассуждение с пространственно-временными якорями и обучением с подкреплением для улучшения кинематографического описания видео. Метод связывает профессиональные описания на языке кино с явными визуальными доказательствами, балансируя между полнотой описания и фактической точностью.

media AI News (smol.ai) · 8 ч назад

Anthropic запускает Claude Tag, асинхронный инструмент делегирования задач для Slack

Anthropic запустила Claude Tag, новую функцию рабочего процесса, которая позволяет командам делегировать задачи Claude асинхронно в рамках Slack. Позиционируемая как переход от чата с одним пользователем к командному взаимодействию, эта функция позволяет Claude присоединиться к команде в качестве участника с доступом к выбранным каналам, инструментам и кодовым базам.

lab NVIDIA Technical Blog · 8 ч назад

Максимизация энергоэффективности ИИ-фабрики за счёт оптимизации вывода и обучения на всех уровнях стека

Потребление энергии составляет 40% операционных расходов (OpEx) на работу ИИ-фабрики, а производительность на ватт становится критическим показателем эффективности, напрямую влияющим на стоимость токенов.

media r/LocalLLaMA · 8 ч назад

Создание веб-слоя доступа для локальных AI-агентов

Разработчик делится опытом создания централизованного веб-слоя доступа для управления взаимодействиями между локальными AI-моделями и внешними сервисами. Этот подход решает проблему поддержки множества отдельных интеграций для каждого нового проекта с агентом.

media r/LocalLLaMA · 8 ч назад

NASA тестирует локальный вывод LLM для будущих космических миссий

Исследователи Red Hat и NASA разрабатывают Цифрового Ассистента Врача Экипажа (CMO-DA), медицинскую ИИ-систему, которая запускает большие языковые модели на локальном оборудовании без зависимости от облака. Эта инициатива решает проблему непрактичности наземного телемедицинского обслуживания для астронавтов в миссиях к Луне или Марсу из-за задержки сигнала и перебоев связи.

media r/LocalLLaMA · 8 ч назад

Настройка H200 NVL на потребительском (почти) оборудовании

Пользователь успешно настроил GPU NVIDIA H200 NVL на рабочей станции, собранной на базе материнской платы ASUS WRX90E-SAGE SE и 64-ядерного процессора Threadripper, продемонстрировав, что высокопроизводительные AI-ускорители могут работать на не серверном оборудовании.

media r/LocalLLaMA · 8 ч назад

GLM 5.2 только на CPU: Epyc и 512 ГБ ОЗУ

Пользователь протестировал 4-битную версию GLM-5.2 (GLM-5.2-UD-Q4_K_XL) на сервере с процессором AMD Epyc Rome 7452 и 512 ГБ ОЗУ. Модель оценивалась с использованием сложного промпта для программирования, требующего создания самодостаточной 3D-игры в формате HTML, CSS и JavaScript.

media Hugging Face Forums · 8 ч назад

Пользователь не может перезапустить приватный Hugging Face Space из-за ошибки 503

Пользователь сообщает, что его приватный Hugging Face Space, а именно 'Ark-kun/tangent', внезапно перестал работать и не может быть перезапущен. Попытки перезапуска или выполнения заводской сборки (factory rebuild) завершаются ошибкой "503. Something went wrong when restarting this Space".

lab NVIDIA Technical Blog · 9 ч назад

Ускорение вывода до 15 раз на NVIDIA Blackwell с помощью DFlash спекулятивного декодирования

NVIDIA представляет DFlash спекулятивное декодирование для значительного ускорения производительности вывода на своей архитектуре Blackwell, решая проблемы задержек, присущие авторегрессионным LLM.

lab NVIDIA Technical Blog · 9 ч назад

Создайте ученого-искусственного интеллекта для открытий в области наук о жизни с помощью набора инструментов NVIDIA BioNeMo Agent

NVIDIA представляет набор инструментов BioNeMo Agent Toolkit для облегчения создания ученых-искусственного интеллекта, способных читать научные статьи, писать код и генерировать гипотезы для открытий в области наук о жизни.

lab NVIDIA Technical Blog · 9 ч назад

Как телеком-операторы строят автономные сети с помощью агентного ИИ

Телеком-операторы внедряют ИИ во все аспекты работы сетей, обслуживания клиентов и бэк-офисных процессов, однако большинство из них находятся лишь на ранних этапах пути к полной автономности. Текущие усилия по автоматизации обычно работают на уровнях 2–3 по таксономии TM Forum, фокусируясь на оптимизации заранее определенных решений в отдельных доменах.

media Latent Space · 9 ч назад

Доход Neocloud от SpaceX достигает $28 млрд в год на фоне обновлений OpenAI и Sakana

SpaceX заключила третью сделку по аренде GPU с Reflection AI, что выводит её годовую выручку примерно до $28 млрд при расчётной ставке более $10 в час за GPU Blackwell. Эта оценка примерно вдвое превышает оценку Coreweave, что подчеркивает быстрый рост и высокую ценовую власть на рынке ИИ-инфраструктуры.

media r/LocalLLaMA · 9 ч назад

Kimi и GLM в области передового кода

Этот пост на Reddit от пользователя Charuru содержит изображение под названием «Kimi и GLM в области передового кода». Материал служит визуальным справочником или поводом для обсуждения производительности моделей Kimi и GLM в задачах программирования.

media Hugging Face Forums · 9 ч назад

Ainara: локальный ИИ-ассистент с постоянной памятью и переключением LLM

Ainara — это десктопное приложение, ориентированное на локальное выполнение, от разработчика из Дублина, которое функционирует как ИИ-компаньон с сохранением контекста между сессиями. Оно позволяет пользователям переключаться между облачными моделями, такими как Grok, Claude и Gemini, или локальными моделями Ollama, сохраняя контекст без разрывов.

media Hugging Face Forums · 9 ч назад

Практический опыт использования ML-суррогатов для CFD и FEA симуляций?

Инженер-симулятор ищет реальный опыт развертывания машинных суррогатов для снижения стоимости дорогостоящих запусков решателей вычислительной гидродинамики (CFD) и метода конечных элементов (FEA).

lab Meta AI / FAIR Blog · 9 ч назад

Brain2Qwerty v2 достигает 61% точности на уровне слов при неинвазивном декодировании текста из мозга

Исследователи выпустили Brain2Qwerty v2, неинвазивный AI-пайплайн, который декодирует предложения в реальном времени по данным магнитоэнцефалографии (MEG) без хирургических имплантатов. Система достигает общей точности на уровне слов 61% и до 78% у лучших участников, значительно превосходя предыдущие неинвазивные методы.

arxiv arXiv cs.LG · 10 ч назад

Использование сходств в многоручных бандитах

В данном исследовании рассматривается онлайн-обучение с множествами действий, структурированными по сходству и закодированными корневыми деревьями, показывая, что стандартная одноточечная обратная связь не может использовать эти сходства. Авторы предлагают унифицированные алгоритмы для более богатых моделей обратной связи, которые заменяют количество действий на эффективное число с учётом сходства для улучшения границ регрета.

arxiv arXiv cs.LG · 10 ч назад

GRINQH: Иерархия квантования на основе градации входных данных для эффективной генерации LLM

Исследователи предлагают GRINQH, фреймворк постобучающего квантования только весов, который ускоряет декодирование больших языковых моделей за счёт объединения квантования и разреженности. Метод динамически назначает каналы весов разным уровням точности на основе величин активаций, решая проблему ограниченности памяти на этапе декодирования.