Wmf — новый экспериментальный метод
Содержимое статьи было удалено автором, поэтому никакой существенной информации о методе нет.
Содержимое статьи было удалено автором, поэтому никакой существенной информации о методе нет.
Непрограммист делится опытом настройки локальной инфраструктуры больших языковых моделей на MacBook M5 Max с 128 ГБ объединённой памяти. Пользователь подробно описывает свой программный стек, выбор моделей и цели изучения ИИ при создании стабильной системы с удалённым доступом.
Together AI представляет девять статей на ICML 2026, охватывающих полный стек разработки своей платформы.
В этой статье представлен ScarfBench, бенчмарк, предназначенный для оценки производительности ИИ-агентов при миграции корпоративных приложений Java между различными фреймворками. Исследование подчеркивает сложность миграции фреймворков и предлагает стандартизированный метод оценки возможностей агентов в этой области.
Выпуск crewAI 1.15.2a1 включает несколько новых функций, исправлений ошибок и обновлений документации для фреймворка оркестрации агентов.
Проект llama.cpp выпустил версию b9856, внося последовательное использование ключевого слова `restrict` и PDL для Flash Attention в CUDA. Это обновление сопровождается предварительно собранными бинарными файлами для macOS, Linux, Android, Windows и openEuler на различных аппаратных бэкендах.
Обновление удаляет механизм резервного перехода Progressive Web App (PWA). Это изменение введено специально для предотвращения непреднамеренного кэширования запросов к конечным точкам API.
Проект llama.cpp выпустил версию b9852, в которой представлена начальная поддержка формата квантования q1_0 для OpenCL. Это обновление включает общие возможности q1_0 и специфичные реализации Adreno GEMM/GEMV для устройств OpenCL.
Anthropic восстанавливает глобальный доступ к своим моделям Claude Fable 5 и Mythos 5 после того, как правительство США сняло экспортные ограничения, которые приостановили доступность для всех пользователей. Fable 5 станет доступен глобально с 1 июля на платформе Claude, при этом будут действовать ограничения по использованию до 7 июля, после чего переход к доступу на основе кредитов.
Проект llama.cpp выпустил версию b9851, которая включает исправление для CUDA, предотвращающее ошибки усечения целых чисел и переполнения в ядре flash_attn_mask_to_KV_max. Это обновление решает проблемы, связанные с шагами маски KQ внутри указанного ядра.
Выпуск llama.cpp b9850 вносит обновления поддержки конкретных моделей, включая регистрацию тензора t_layer_inp для Qwen3Next, исправление назначения входных данных в цикле обработки слоев и устранение проблем DFLASH для qwen-coder-next. Также добавлен тензор для нормализации внимания в модели Qwen3.
Python SDK для Model Context Protocol (MCP) выпустила свою первую бета-версию, v2.0.0b1, которая добавляет полную поддержку спецификации MCP от 28 июля 2026 года. Этот предварительный выпуск доступен только по желанию, что гарантирует, что стандартные установки продолжают указывать на стабильную ветку 1.x.
Microsoft Research представляет SkillOpt — метод, который рассматривает файлы навыков агента как обучаемые параметры вне замороженной целевой модели, превращая ручное редактирование навыков в контролируемый процесс оптимизации. Этот подход повышает надежность и согласованность работы агентов без обновления весов базовой модели.
Anthropic запустила Claude Science в бета-версии — рабочую среду на базе ИИ, предназначенную для интеграции разрозненных научных инструментов в единое исследовательское пространство. Платформа стремится ускорить открытия за счет предоставления проверяемых артефактов, гибкого масштабирования вычислений и специализированных агентов для таких областей, как геномика и структурная биология.
Anthropic выпустила Claude Sonnet 5, новую агентную ИИ-модель, предназначенную для выполнения сложных задач планирования, использования инструментов и автономного программирования по более низкой стоимости, чем предыдущие модели класса Opus. Обновление сокращает разрыв в производительности с Opus 4.8, одновременно предлагая значительные улучшения в рассуждениях, безопасности и исполнении по сравнению с предшественником Sonnet 4.6.
Anthropic выпустила версию 2.1.197 Claude Code, которая обновляет модель по умолчанию до Claude Sonnet 5. Эта новая модель имеет нативное контекстное окно на 1M токенов и доступна по акционной цене до 31 августа.
GeneBench-Pro — это бенчмарк, предназначенный для оценки моделей на задачах сложного геномного рассуждения, включающий десять подробных кейсов, демонстрирующих репрезентативные вопросы и вспомогательные материалы. Каждый кейс предоставляет исходный промпт, наборы данных и контекст, необходимые для оценки производительности модели при решении конкретных биологических задач.
GeneBench-Pro — это исследовательский бенчмарк, предназначенный для оценки того, как ИИ-агенты справляются с неоднозначностью и принимают важные решения в вычислительной биологии, расширяя возможности оригинального GeneBench. Он устраняет ограничения текущих оценок, проверяя более высокие способности, такие как обработка шумов данных, пересмотр предположений и определение момента готовности результатов для принятия решений.
Инженеры OpenAI устранили необъяснимые сбои C++ в своей инфраструктуре данных Rockset, выявив две различные причины: скрытую аппаратную порчу на хосте Azure и состояние гонки (race condition) в GNU libunwind, существующее уже 18 лет.
Данные OpenAI Signals показывают, что внедрение ChatGPT расширяется и углубляется в глобальном масштабе: пользователи отправляют на 50% больше сообщений ежедневно и удваивают количество уникальных задач, которые они пробуют через шесть месяцев после регистрации.