Все статьи — korshunov.ai

Все статьи Страница 1 / 119

Мы все с чего-то начинаем

Разработчик с более чем 25-летним опытом в веб-технологиях переходит в инженерное направление по ИИ, чтобы выйти за рамки использования инструментов и понять, как их создавать.

media Hugging Face Forums · 7 ч назад

Пользователь не может перезапустить приватный Hugging Face Space из-за ошибки 503

Пользователь сообщает, что его приватный Hugging Face Space, а именно 'Ark-kun/tangent', внезапно перестал работать и не может быть перезапущен. Попытки перезапуска или выполнения заводской сборки (factory rebuild) завершаются ошибкой "503. Something went wrong when restarting this Space".

lab NVIDIA Technical Blog · 8 ч назад

Ускорение вывода до 15 раз на NVIDIA Blackwell с помощью DFlash спекулятивного декодирования

NVIDIA представляет DFlash спекулятивное декодирование для значительного ускорения производительности вывода на своей архитектуре Blackwell, решая проблемы задержек, присущие авторегрессионным LLM.

lab NVIDIA Technical Blog · 8 ч назад

Создайте ученого-искусственного интеллекта для открытий в области наук о жизни с помощью набора инструментов NVIDIA BioNeMo Agent

NVIDIA представляет набор инструментов BioNeMo Agent Toolkit для облегчения создания ученых-искусственного интеллекта, способных читать научные статьи, писать код и генерировать гипотезы для открытий в области наук о жизни.

lab NVIDIA Technical Blog · 8 ч назад

Как телеком-операторы строят автономные сети с помощью агентного ИИ

Телеком-операторы внедряют ИИ во все аспекты работы сетей, обслуживания клиентов и бэк-офисных процессов, однако большинство из них находятся лишь на ранних этапах пути к полной автономности. Текущие усилия по автоматизации обычно работают на уровнях 2–3 по таксономии TM Forum, фокусируясь на оптимизации заранее определенных решений в отдельных доменах.

media Latent Space · 8 ч назад

Доход Neocloud от SpaceX достигает $28 млрд в год на фоне обновлений OpenAI и Sakana

SpaceX заключила третью сделку по аренде GPU с Reflection AI, что выводит её годовую выручку примерно до $28 млрд при расчётной ставке более $10 в час за GPU Blackwell. Эта оценка примерно вдвое превышает оценку Coreweave, что подчеркивает быстрый рост и высокую ценовую власть на рынке ИИ-инфраструктуры.

media r/LocalLLaMA · 8 ч назад

Kimi и GLM в области передового кода

Этот пост на Reddit от пользователя Charuru содержит изображение под названием «Kimi и GLM в области передового кода». Материал служит визуальным справочником или поводом для обсуждения производительности моделей Kimi и GLM в задачах программирования.

media Hugging Face Forums · 8 ч назад

Ainara: локальный ИИ-ассистент с постоянной памятью и переключением LLM

Ainara — это десктопное приложение, ориентированное на локальное выполнение, от разработчика из Дублина, которое функционирует как ИИ-компаньон с сохранением контекста между сессиями. Оно позволяет пользователям переключаться между облачными моделями, такими как Grok, Claude и Gemini, или локальными моделями Ollama, сохраняя контекст без разрывов.

media Hugging Face Forums · 8 ч назад

Практический опыт использования ML-суррогатов для CFD и FEA симуляций?

Инженер-симулятор ищет реальный опыт развертывания машинных суррогатов для снижения стоимости дорогостоящих запусков решателей вычислительной гидродинамики (CFD) и метода конечных элементов (FEA).

lab Meta AI / FAIR Blog · 8 ч назад

Brain2Qwerty v2 достигает 61% точности на уровне слов при неинвазивном декодировании текста из мозга

Исследователи выпустили Brain2Qwerty v2, неинвазивный AI-пайплайн, который декодирует предложения в реальном времени по данным магнитоэнцефалографии (MEG) без хирургических имплантатов. Система достигает общей точности на уровне слов 61% и до 78% у лучших участников, значительно превосходя предыдущие неинвазивные методы.

media AI News (smol.ai) · 9 ч назад

OpenAI расширяет Daybreak, Sakana выпускает Fugu, GLM-5.2 набирает популярность

В новостях ИИ этой недели выделяются расширение программ кибербезопасности OpenAI, выпуск системой оркестрации Fugu от Sakana AI и растущее распространение модели с открытыми весами GLM-5.2.

arxiv arXiv cs.LG · 9 ч назад

Использование сходств в многоручных бандитах

В данном исследовании рассматривается онлайн-обучение с множествами действий, структурированными по сходству и закодированными корневыми деревьями, показывая, что стандартная одноточечная обратная связь не может использовать эти сходства. Авторы предлагают унифицированные алгоритмы для более богатых моделей обратной связи, которые заменяют количество действий на эффективное число с учётом сходства для улучшения границ регрета.

arxiv arXiv cs.LG · 9 ч назад

GRINQH: Иерархия квантования на основе градации входных данных для эффективной генерации LLM

Исследователи предлагают GRINQH, фреймворк постобучающего квантования только весов, который ускоряет декодирование больших языковых моделей за счёт объединения квантования и разреженности. Метод динамически назначает каналы весов разным уровням точности на основе величин активаций, решая проблему ограниченности памяти на этапе декодирования.

media r/LocalLLaMA · 9 ч назад

Есть ли хорошие варианты использования сервера с 192 ГБ DDR3 в мире LLM?

Пользователь Reddit спрашивает о вариантах использования старого сервера IBM System X V4, оснащённого двумя процессорами Xeon E5-2640 и 192 ГБ ОЗУ DDR3 ECC для больших языковых моделей.

media r/LocalLLaMA · 9 ч назад

Как улучшить время отклика, кэшируя системный промпт?

Пользователь на r/LocalLLaMA спрашивает, как сократить примерно 10-секундное время обработки системного промпта длиной в 7.1k токенов для каждой новой сессии при использовании Ornith 35b с llama.cpp.

media r/LocalLLaMA · 9 ч назад

Возможно ли создание вредоносной LLM с бэкдором

Пользователь Reddit предлагает возможность обучения больших языковых моделей распознаванию конкретного секретного предложения, которое активирует вредоносное поведение, что вызывает опасения относительно рисков безопасности как для закрытых, так и для моделей с открытым исходным кодом.

media r/LocalLLaMA · 9 ч назад

Мы все с чего-то начинаем

Пользователь не может перезапустить приватный Hugging Face Space из-за ошибки 503

Ускорение вывода до 15 раз на NVIDIA Blackwell с помощью DFlash спекулятивного декодирования

Создайте ученого-искусственного интеллекта для открытий в области наук о жизни с помощью набора инструментов NVIDIA BioNeMo Agent

Как телеком-операторы строят автономные сети с помощью агентного ИИ

Доход Neocloud от SpaceX достигает $28 млрд в год на фоне обновлений OpenAI и Sakana

Kimi и GLM в области передового кода

Ainara: локальный ИИ-ассистент с постоянной памятью и переключением LLM

Практический опыт использования ML-суррогатов для CFD и FEA симуляций?

Brain2Qwerty v2 достигает 61% точности на уровне слов при неинвазивном декодировании текста из мозга

OpenAI расширяет Daybreak, Sakana выпускает Fugu, GLM-5.2 набирает популярность

Использование сходств в многоручных бандитах

GRINQH: Иерархия квантования на основе градации входных данных для эффективной генерации LLM

Есть ли хорошие варианты использования сервера с 192 ГБ DDR3 в мире LLM?

Как улучшить время отклика, кэшируя системный промпт?

Возможно ли создание вредоносной LLM с бэкдором

Официальный запуск Deepseek V4 состоится в середине июля с изменениями цен на API

Пропуск блоков трансформера во время выполнения с помощью llama.cpp

Лучший способ тестирования моделей с разными уровнями квантования перед покупкой GPU

Выпуск llama.cpp b9840 добавляет поддержку DeepSeek V4 и мультиплатформенные бинарники