Все статьи
media Hugging Face Forums · 5 ч назад

Локальная LLM на MacBook M5 Pro — я новичок в этом!

Непрограммист делится опытом настройки локальной инфраструктуры больших языковых моделей на MacBook M5 Max с 128 ГБ объединённой памяти. Пользователь подробно описывает свой программный стек, выбор моделей и цели изучения ИИ при создании стабильной системы с удалённым доступом.

lab Hugging Face Blog · 7 ч назад

ScarfBench: Оценка ИИ-агентов для миграции на фреймворки Enterprise Java

В этой статье представлен ScarfBench, бенчмарк, предназначенный для оценки производительности ИИ-агентов при миграции корпоративных приложений Java между различными фреймворками. Исследование подчеркивает сложность миграции фреймворков и предлагает стандартизированный метод оценки возможностей агентов в этой области.

github llama.cpp · 20 ч назад

Выпуск llama.cpp b9856 с CUDA restrict + PDL для FA

Проект llama.cpp выпустил версию b9856, внося последовательное использование ключевого слова `restrict` и PDL для Flash Attention в CUDA. Это обновление сопровождается предварительно собранными бинарными файлами для macOS, Linux, Android, Windows и openEuler на различных аппаратных бэкендах.

github llama.cpp · 1 д назад

Удалить резервный переход PWA для предотвращения кэширования запросов к конечным точкам API

Обновление удаляет механизм резервного перехода Progressive Web App (PWA). Это изменение введено специально для предотвращения непреднамеренного кэширования запросов к конечным точкам API.

github llama.cpp · 1 д назад

Выпуск llama.cpp b9852 добавляет поддержку q1_0 для OpenCL

Проект llama.cpp выпустил версию b9852, в которой представлена начальная поддержка формата квантования q1_0 для OpenCL. Это обновление включает общие возможности q1_0 и специфичные реализации Adreno GEMM/GEMV для устройств OpenCL.

lab Anthropic News · 1 д назад

Anthropic повторно развертывает Fable 5 после экспортных ограничений США

Anthropic восстанавливает глобальный доступ к своим моделям Claude Fable 5 и Mythos 5 после того, как правительство США сняло экспортные ограничения, которые приостановили доступность для всех пользователей. Fable 5 станет доступен глобально с 1 июля на платформе Claude, при этом будут действовать ограничения по использованию до 7 июля, после чего переход к доступу на основе кредитов.

github llama.cpp · 1 д назад

Выпуск llama.cpp b9851 исправляет усечение целых чисел в CUDA и предоставляет бинарные файлы

Проект llama.cpp выпустил версию b9851, которая включает исправление для CUDA, предотвращающее ошибки усечения целых чисел и переполнения в ядре flash_attn_mask_to_KV_max. Это обновление решает проблемы, связанные с шагами маски KQ внутри указанного ядра.

github llama.cpp · 1 д назад

Выпуск llama.cpp b9850: исправления для Qwen3 и новые бинарные файлы

Выпуск llama.cpp b9850 вносит обновления поддержки конкретных моделей, включая регистрацию тензора t_layer_inp для Qwen3Next, исправление назначения входных данных в цикле обработки слоев и устранение проблем DFLASH для qwen-coder-next. Также добавлен тензор для нормализации внимания в модели Qwen3.

github MCP (GitHub org) · 1 д назад

Выпущен MCP Python SDK v2.0.0b1 с полной поддержкой спецификации 2026 года

Python SDK для Model Context Protocol (MCP) выпустила свою первую бета-версию, v2.0.0b1, которая добавляет полную поддержку спецификации MCP от 28 июля 2026 года. Этот предварительный выпуск доступен только по желанию, что гарантирует, что стандартные установки продолжают указывать на стабильную ветку 1.x.

lab Microsoft Research Blog · 1 д назад

SkillOpt: Навыки агентов как обучаемые параметры

Microsoft Research представляет SkillOpt — метод, который рассматривает файлы навыков агента как обучаемые параметры вне замороженной целевой модели, превращая ручное редактирование навыков в контролируемый процесс оптимизации. Этот подход повышает надежность и согласованность работы агентов без обновления весов базовой модели.

lab Anthropic News · 2 д назад

Claude Science, рабочая среда для ученых на базе ИИ, теперь доступна

Anthropic запустила Claude Science в бета-версии — рабочую среду на базе ИИ, предназначенную для интеграции разрозненных научных инструментов в единое исследовательское пространство. Платформа стремится ускорить открытия за счет предоставления проверяемых артефактов, гибкого масштабирования вычислений и специализированных агентов для таких областей, как геномика и структурная биология.

lab Anthropic News · 2 д назад

Представляем Claude Sonnet 5

Anthropic выпустила Claude Sonnet 5, новую агентную ИИ-модель, предназначенную для выполнения сложных задач планирования, использования инструментов и автономного программирования по более низкой стоимости, чем предыдущие модели класса Opus. Обновление сокращает разрыв в производительности с Opus 4.8, одновременно предлагая значительные улучшения в рассуждениях, безопасности и исполнении по сравнению с предшественником Sonnet 4.6.

lab OpenAI News · 2 д назад

Внутри GeneBench-Pro: 10 кейсов сложного геномного рассуждения

GeneBench-Pro — это бенчмарк, предназначенный для оценки моделей на задачах сложного геномного рассуждения, включающий десять подробных кейсов, демонстрирующих репрезентативные вопросы и вспомогательные материалы. Каждый кейс предоставляет исходный промпт, наборы данных и контекст, необходимые для оценки производительности модели при решении конкретных биологических задач.

lab OpenAI News · 2 д назад

Представляем GeneBench-Pro

GeneBench-Pro — это исследовательский бенчмарк, предназначенный для оценки того, как ИИ-агенты справляются с неоднозначностью и принимают важные решения в вычислительной биологии, расширяя возможности оригинального GeneBench. Он устраняет ограничения текущих оценок, проверяя более высокие способности, такие как обработка шумов данных, пересмотр предположений и определение момента готовности результатов для принятия решений.

lab OpenAI News · 2 д назад

Эпидемиология дампов ядра: исправление 18-летней ошибки

Инженеры OpenAI устранили необъяснимые сбои C++ в своей инфраструктуре данных Rockset, выявив две различные причины: скрытую аппаратную порчу на хосте Azure и состояние гонки (race condition) в GNU libunwind, существующее уже 18 лет.

lab OpenAI News · 2 д назад

Как расширяется внедрение ChatGPT

Данные OpenAI Signals показывают, что внедрение ChatGPT расширяется и углубляется в глобальном масштабе: пользователи отправляют на 50% больше сообщений ежедневно и удваивают количество уникальных задач, которые они пробуют через шесть месяцев после регистрации.