Все статьи
media Hugging Face Forums · 7 ч назад

Пользователь не может перезапустить приватный Hugging Face Space из-за ошибки 503

Пользователь сообщает, что его приватный Hugging Face Space, а именно 'Ark-kun/tangent', внезапно перестал работать и не может быть перезапущен. Попытки перезапуска или выполнения заводской сборки (factory rebuild) завершаются ошибкой "503. Something went wrong when restarting this Space".

lab NVIDIA Technical Blog · 8 ч назад

Ускорение вывода до 15 раз на NVIDIA Blackwell с помощью DFlash спекулятивного декодирования

NVIDIA представляет DFlash спекулятивное декодирование для значительного ускорения производительности вывода на своей архитектуре Blackwell, решая проблемы задержек, присущие авторегрессионным LLM.

lab NVIDIA Technical Blog · 8 ч назад

Создайте ученого-искусственного интеллекта для открытий в области наук о жизни с помощью набора инструментов NVIDIA BioNeMo Agent

NVIDIA представляет набор инструментов BioNeMo Agent Toolkit для облегчения создания ученых-искусственного интеллекта, способных читать научные статьи, писать код и генерировать гипотезы для открытий в области наук о жизни.

lab NVIDIA Technical Blog · 8 ч назад

Как телеком-операторы строят автономные сети с помощью агентного ИИ

Телеком-операторы внедряют ИИ во все аспекты работы сетей, обслуживания клиентов и бэк-офисных процессов, однако большинство из них находятся лишь на ранних этапах пути к полной автономности. Текущие усилия по автоматизации обычно работают на уровнях 2–3 по таксономии TM Forum, фокусируясь на оптимизации заранее определенных решений в отдельных доменах.

media Latent Space · 8 ч назад

Доход Neocloud от SpaceX достигает $28 млрд в год на фоне обновлений OpenAI и Sakana

SpaceX заключила третью сделку по аренде GPU с Reflection AI, что выводит её годовую выручку примерно до $28 млрд при расчётной ставке более $10 в час за GPU Blackwell. Эта оценка примерно вдвое превышает оценку Coreweave, что подчеркивает быстрый рост и высокую ценовую власть на рынке ИИ-инфраструктуры.

media r/LocalLLaMA · 8 ч назад

Kimi и GLM в области передового кода

Этот пост на Reddit от пользователя Charuru содержит изображение под названием «Kimi и GLM в области передового кода». Материал служит визуальным справочником или поводом для обсуждения производительности моделей Kimi и GLM в задачах программирования.

media Hugging Face Forums · 8 ч назад

Ainara: локальный ИИ-ассистент с постоянной памятью и переключением LLM

Ainara — это десктопное приложение, ориентированное на локальное выполнение, от разработчика из Дублина, которое функционирует как ИИ-компаньон с сохранением контекста между сессиями. Оно позволяет пользователям переключаться между облачными моделями, такими как Grok, Claude и Gemini, или локальными моделями Ollama, сохраняя контекст без разрывов.

media Hugging Face Forums · 8 ч назад

Практический опыт использования ML-суррогатов для CFD и FEA симуляций?

Инженер-симулятор ищет реальный опыт развертывания машинных суррогатов для снижения стоимости дорогостоящих запусков решателей вычислительной гидродинамики (CFD) и метода конечных элементов (FEA).

lab Meta AI / FAIR Blog · 8 ч назад

Brain2Qwerty v2 достигает 61% точности на уровне слов при неинвазивном декодировании текста из мозга

Исследователи выпустили Brain2Qwerty v2, неинвазивный AI-пайплайн, который декодирует предложения в реальном времени по данным магнитоэнцефалографии (MEG) без хирургических имплантатов. Система достигает общей точности на уровне слов 61% и до 78% у лучших участников, значительно превосходя предыдущие неинвазивные методы.

arxiv arXiv cs.LG · 9 ч назад

Использование сходств в многоручных бандитах

В данном исследовании рассматривается онлайн-обучение с множествами действий, структурированными по сходству и закодированными корневыми деревьями, показывая, что стандартная одноточечная обратная связь не может использовать эти сходства. Авторы предлагают унифицированные алгоритмы для более богатых моделей обратной связи, которые заменяют количество действий на эффективное число с учётом сходства для улучшения границ регрета.

arxiv arXiv cs.LG · 9 ч назад

GRINQH: Иерархия квантования на основе градации входных данных для эффективной генерации LLM

Исследователи предлагают GRINQH, фреймворк постобучающего квантования только весов, который ускоряет декодирование больших языковых моделей за счёт объединения квантования и разреженности. Метод динамически назначает каналы весов разным уровням точности на основе величин активаций, решая проблему ограниченности памяти на этапе декодирования.

media r/LocalLLaMA · 9 ч назад

Возможно ли создание вредоносной LLM с бэкдором

Пользователь Reddit предлагает возможность обучения больших языковых моделей распознаванию конкретного секретного предложения, которое активирует вредоносное поведение, что вызывает опасения относительно рисков безопасности как для закрытых, так и для моделей с открытым исходным кодом.

media r/LocalLLaMA · 9 ч назад

Официальный запуск Deepseek V4 состоится в середине июля с изменениями цен на API

Пост в сообществе r/LocalLLaMA на Reddit обсуждает изображение, предполагающее, что официальный запуск Deepseek V4 состоится в середине июля и будет сопровождаться изменениями в структуре ценообразования API.

media r/LocalLLaMA · 9 ч назад

Пропуск блоков трансформера во время выполнения с помощью llama.cpp

Форк llama.cpp внедряет флаг --skip-layers, который позволяет пользователям пропускать целые блоки трансформера на этапе загрузки, предлагая альтернативу или дополнение к квантованию для размещения моделей в условиях ограниченного оборудования.

media r/LocalLLaMA · 9 ч назад

Лучший способ тестирования моделей с разными уровнями квантования перед покупкой GPU

Пользователь Reddit ищет советы о наиболее эффективном методе тестирования производительности моделей на различных уровнях квантования перед покупкой нового оборудования.

github llama.cpp · 9 ч назад

Выпуск llama.cpp b9840 добавляет поддержку DeepSeek V4 и мультиплатформенные бинарники

Выпуск llama.cpp b9840 вводит поддержку конвертации для модели DeepSeek V4, включая специальную обработку варианта Pro. Это обновление интегрирует новую архитектуру в библиотеку наряду с различными внутренними оптимизациями и исправлениями ошибок.