Все статьи
arxiv arXiv cs.AI · 4 ч назад

Themis: Объяснимая платформа на базе ИИ для обучения с подкреплением по отзывам человека

Авторы представляют Themis, платформу тестирования и оценки на основе объяснимого ИИ (XAI), которая сочетает прозрачность через объяснимость с выравниванием посредством отзывов человека для безопасных систем обучения с подкреплением.

arxiv arXiv cs.AI · 4 ч назад

Сохранение конфиденциальности в RAG с помощью многоагентной семантической переформулировки

Авторы предлагают многоагентную архитектуру, которая очищает извлеченный контент в системах Retrieval-Augmented Generation (RAG) посредством семантической переформулировки для предотвращения утечки конфиденциальных данных из вредоносных запросов. Используя три специализированных агента для извлечения конфиденциальной информации, семантического анализа и реконструкции, подход удаляет чувствительные идентификаторы, сохраняя основной смысл текста.

arxiv arXiv cs.AI · 4 ч назад

SAFARI: Масштабирование атрибуции сбоев агентов на длинных горизонтах через активное расследование

Статья представляет SAFARI, фреймворк, предназначенный для диагностики сбоев автономных агентов путем замены линейной загрузки контекста на диагностический цикл с расширенными инструментами. Этот подход отделяет точность диагностики от архитектурных ограничений контекста за счет использования специализированных инструментов и кратковременной памяти для анализа сегментов траектории.

arxiv arXiv cs.AI · 4 ч назад

Визуализация «Мы, народ»: преодоление разрыва в восприятии через плюралистическое повествование на основе данных

В данной статье рассматривается, как целенаправленные плюралистические дизайнерские решения в цифровых платформах с поддержкой ИИ могут создавать визуализации, подчеркивающие нюансы и общие черты между группами, тем самым снижая политическую поляризацию. Особое внимание уделяется конкретной инициативе в области технологий для обсуждений, которая отображает многомерные пространства мнений, выявляя области как консенсуса, так и разногласий среди разнообразных групп населения.

arxiv arXiv cs.AI · 4 ч назад

CineCap: Структурированное рассуждение с пространственно-временными якорями для кинематографического описания видео

Исследователи предлагают CineCap, фреймворк, который объединяет структурированное рассуждение с пространственно-временными якорями и обучением с подкреплением для улучшения кинематографического описания видео. Метод связывает профессиональные описания на языке кино с явными визуальными доказательствами, балансируя между полнотой описания и фактической точностью.

media AI News (smol.ai) · 4 ч назад

Anthropic запускает Claude Tag, асинхронный инструмент делегирования задач для Slack

Anthropic запустила Claude Tag, новую функцию рабочего процесса, которая позволяет командам делегировать задачи Claude асинхронно в рамках Slack. Позиционируемая как переход от чата с одним пользователем к командному взаимодействию, эта функция позволяет Claude присоединиться к команде в качестве участника с доступом к выбранным каналам, инструментам и кодовым базам.

lab NVIDIA Technical Blog · 4 ч назад

Максимизация энергоэффективности ИИ-фабрики за счёт оптимизации вывода и обучения на всех уровнях стека

Потребление энергии составляет 40% операционных расходов (OpEx) на работу ИИ-фабрики, а производительность на ватт становится критическим показателем эффективности, напрямую влияющим на стоимость токенов.

media r/LocalLLaMA · 4 ч назад

Создание веб-слоя доступа для локальных AI-агентов

Разработчик делится опытом создания централизованного веб-слоя доступа для управления взаимодействиями между локальными AI-моделями и внешними сервисами. Этот подход решает проблему поддержки множества отдельных интеграций для каждого нового проекта с агентом.

media r/LocalLLaMA · 4 ч назад

NASA тестирует локальный вывод LLM для будущих космических миссий

Исследователи Red Hat и NASA разрабатывают Цифрового Ассистента Врача Экипажа (CMO-DA), медицинскую ИИ-систему, которая запускает большие языковые модели на локальном оборудовании без зависимости от облака. Эта инициатива решает проблему непрактичности наземного телемедицинского обслуживания для астронавтов в миссиях к Луне или Марсу из-за задержки сигнала и перебоев связи.

media r/LocalLLaMA · 4 ч назад

Настройка H200 NVL на потребительском (почти) оборудовании

Пользователь успешно настроил GPU NVIDIA H200 NVL на рабочей станции, собранной на базе материнской платы ASUS WRX90E-SAGE SE и 64-ядерного процессора Threadripper, продемонстрировав, что высокопроизводительные AI-ускорители могут работать на не серверном оборудовании.

media r/LocalLLaMA · 4 ч назад

GLM 5.2 только на CPU: Epyc и 512 ГБ ОЗУ

Пользователь протестировал 4-битную версию GLM-5.2 (GLM-5.2-UD-Q4_K_XL) на сервере с процессором AMD Epyc Rome 7452 и 512 ГБ ОЗУ. Модель оценивалась с использованием сложного промпта для программирования, требующего создания самодостаточной 3D-игры в формате HTML, CSS и JavaScript.

media Hugging Face Forums · 4 ч назад

Пользователь не может перезапустить приватный Hugging Face Space из-за ошибки 503

Пользователь сообщает, что его приватный Hugging Face Space, а именно 'Ark-kun/tangent', внезапно перестал работать и не может быть перезапущен. Попытки перезапуска или выполнения заводской сборки (factory rebuild) завершаются ошибкой "503. Something went wrong when restarting this Space".

lab NVIDIA Technical Blog · 5 ч назад

Ускорение вывода до 15 раз на NVIDIA Blackwell с помощью DFlash спекулятивного декодирования

NVIDIA представляет DFlash спекулятивное декодирование для значительного ускорения производительности вывода на своей архитектуре Blackwell, решая проблемы задержек, присущие авторегрессионным LLM.

lab NVIDIA Technical Blog · 5 ч назад

Создайте ученого-искусственного интеллекта для открытий в области наук о жизни с помощью набора инструментов NVIDIA BioNeMo Agent

NVIDIA представляет набор инструментов BioNeMo Agent Toolkit для облегчения создания ученых-искусственного интеллекта, способных читать научные статьи, писать код и генерировать гипотезы для открытий в области наук о жизни.

lab NVIDIA Technical Blog · 5 ч назад

Как телеком-операторы строят автономные сети с помощью агентного ИИ

Телеком-операторы внедряют ИИ во все аспекты работы сетей, обслуживания клиентов и бэк-офисных процессов, однако большинство из них находятся лишь на ранних этапах пути к полной автономности. Текущие усилия по автоматизации обычно работают на уровнях 2–3 по таксономии TM Forum, фокусируясь на оптимизации заранее определенных решений в отдельных доменах.

media Latent Space · 5 ч назад

Доход Neocloud от SpaceX достигает $28 млрд в год на фоне обновлений OpenAI и Sakana

SpaceX заключила третью сделку по аренде GPU с Reflection AI, что выводит её годовую выручку примерно до $28 млрд при расчётной ставке более $10 в час за GPU Blackwell. Эта оценка примерно вдвое превышает оценку Coreweave, что подчеркивает быстрый рост и высокую ценовую власть на рынке ИИ-инфраструктуры.

media r/LocalLLaMA · 5 ч назад

Kimi и GLM в области передового кода

Этот пост на Reddit от пользователя Charuru содержит изображение под названием «Kimi и GLM в области передового кода». Материал служит визуальным справочником или поводом для обсуждения производительности моделей Kimi и GLM в задачах программирования.

media Hugging Face Forums · 5 ч назад

Ainara: локальный ИИ-ассистент с постоянной памятью и переключением LLM

Ainara — это десктопное приложение, ориентированное на локальное выполнение, от разработчика из Дублина, которое функционирует как ИИ-компаньон с сохранением контекста между сессиями. Оно позволяет пользователям переключаться между облачными моделями, такими как Grok, Claude и Gemini, или локальными моделями Ollama, сохраняя контекст без разрывов.