Все статьи
lab Google — The Keyword (AI) · 2 ч назад

Педагоги Нью-Йорка и лидеры индустрии собрались в Google, чтобы формировать ИИ в классах

Google, Совет генеральных директоров по рабочим местам Нью-Йорка (NYC Jobs CEO Council) и Urban Assembly провели саммит по ИИ для 150 лидеров в сфере образования и индустрии в офисах Google. Мероприятие объединило заинтересованные стороны для обсуждения и формирования будущего интеграции искусственного интеллекта в образовательной среде.

github llama.cpp · 3 ч назад

Выпуск llama.cpp b9859 добавляет поддержку предварительно скомпилированных ядер OpenCL

Выпуск llama.cpp b9859 вводит возможность загрузки предварительно скомпилированных бинарных ядер из библиотек для OpenCL, специально ориентированных на GPU Adreno. Это обновление также предоставляет бинарные файлы для macOS, Linux, Windows, Android и openEuler для CPU, GPU и различных ускорителей.

lab xAI News · 4 ч назад

xAI запускает конструктор голосовых агентов без кода для Grok Voice

xAI объявила о бета-версии Voice Agent Builder, платформы без кода, предназначенной для настройки голосовых агентов производственного уровня в Grok Voice за две минуты. Этот инструмент позволяет операторам и разработчикам развертывать высоконагруженные голосовые агенты без создания с нуля базовой телекоммуникационной или ИИ-инфраструктуры.

github llama.cpp · 7 ч назад

Выпуск llama.cpp b9857: переработка Flash Attention и новые бинарники

Выпуск llama.cpp b9857 представляет собой комплексную переработку реализации Hexagon Flash Attention, сфокусированную на оптимизациях и улучшении точности. Это обновление включает значительные изменения в модулях hex-mm и hex-fa, такие как объединение задач квантования с основными потоками умножения матриц (matmul), слияние с операциями ADD и оптимизация обработки масок.

github llama.cpp · 11 ч назад

Выпуск llama.cpp b9856 с CUDA restrict + PDL для FA

Проект llama.cpp выпустил версию b9856, внося последовательное использование ключевого слова `restrict` и PDL для Flash Attention в CUDA. Это обновление сопровождается предварительно собранными бинарными файлами для macOS, Linux, Android, Windows и openEuler на различных аппаратных бэкендах.

github llama.cpp · 15 ч назад

Удалить резервный переход PWA для предотвращения кэширования запросов к конечным точкам API

Обновление удаляет механизм резервного перехода Progressive Web App (PWA). Это изменение введено специально для предотвращения непреднамеренного кэширования запросов к конечным точкам API.

github llama.cpp · 15 ч назад

Выпуск llama.cpp b9852 добавляет поддержку q1_0 для OpenCL

Проект llama.cpp выпустил версию b9852, в которой представлена начальная поддержка формата квантования q1_0 для OpenCL. Это обновление включает общие возможности q1_0 и специфичные реализации Adreno GEMM/GEMV для устройств OpenCL.

lab Anthropic News · 20 ч назад

Anthropic повторно развертывает Fable 5 после экспортных ограничений США

Anthropic восстанавливает глобальный доступ к своим моделям Claude Fable 5 и Mythos 5 после того, как правительство США сняло экспортные ограничения, которые приостановили доступность для всех пользователей. Fable 5 станет доступен глобально с 1 июля на платформе Claude, при этом будут действовать ограничения по использованию до 7 июля, после чего переход к доступу на основе кредитов.

github llama.cpp · 20 ч назад

Выпуск llama.cpp b9851 исправляет усечение целых чисел в CUDA и предоставляет бинарные файлы

Проект llama.cpp выпустил версию b9851, которая включает исправление для CUDA, предотвращающее ошибки усечения целых чисел и переполнения в ядре flash_attn_mask_to_KV_max. Это обновление решает проблемы, связанные с шагами маски KQ внутри указанного ядра.

github llama.cpp · 20 ч назад

Выпуск llama.cpp b9850: исправления для Qwen3 и новые бинарные файлы

Выпуск llama.cpp b9850 вносит обновления поддержки конкретных моделей, включая регистрацию тензора t_layer_inp для Qwen3Next, исправление назначения входных данных в цикле обработки слоев и устранение проблем DFLASH для qwen-coder-next. Также добавлен тензор для нормализации внимания в модели Qwen3.

github MCP (GitHub org) · 22 ч назад

Выпущен MCP Python SDK v2.0.0b1 с полной поддержкой спецификации 2026 года

Python SDK для Model Context Protocol (MCP) выпустила свою первую бета-версию, v2.0.0b1, которая добавляет полную поддержку спецификации MCP от 28 июля 2026 года. Этот предварительный выпуск доступен только по желанию, что гарантирует, что стандартные установки продолжают указывать на стабильную ветку 1.x.

lab Microsoft Research Blog · 1 д назад

SkillOpt: Навыки агентов как обучаемые параметры

Microsoft Research представляет SkillOpt — метод, который рассматривает файлы навыков агента как обучаемые параметры вне замороженной целевой модели, превращая ручное редактирование навыков в контролируемый процесс оптимизации. Этот подход повышает надежность и согласованность работы агентов без обновления весов базовой модели.

lab Anthropic News · 1 д назад

Claude Science, рабочая среда для ученых на базе ИИ, теперь доступна

Anthropic запустила Claude Science в бета-версии — рабочую среду на базе ИИ, предназначенную для интеграции разрозненных научных инструментов в единое исследовательское пространство. Платформа стремится ускорить открытия за счет предоставления проверяемых артефактов, гибкого масштабирования вычислений и специализированных агентов для таких областей, как геномика и структурная биология.

lab Anthropic News · 1 д назад

Представляем Claude Sonnet 5

Anthropic выпустила Claude Sonnet 5, новую агентную ИИ-модель, предназначенную для выполнения сложных задач планирования, использования инструментов и автономного программирования по более низкой стоимости, чем предыдущие модели класса Opus. Обновление сокращает разрыв в производительности с Opus 4.8, одновременно предлагая значительные улучшения в рассуждениях, безопасности и исполнении по сравнению с предшественником Sonnet 4.6.

lab OpenAI News · 1 д назад

Внутри GeneBench-Pro: 10 кейсов сложного геномного рассуждения

GeneBench-Pro — это бенчмарк, предназначенный для оценки моделей на задачах сложного геномного рассуждения, включающий десять подробных кейсов, демонстрирующих репрезентативные вопросы и вспомогательные материалы. Каждый кейс предоставляет исходный промпт, наборы данных и контекст, необходимые для оценки производительности модели при решении конкретных биологических задач.