Все статьи — korshunov.ai

Все статьи Страница 1 / 131

Wmf — новый экспериментальный метод

Содержимое статьи было удалено автором, поэтому никакой существенной информации о методе нет.

Локальная LLM на MacBook M5 Pro — я новичок в этом!

Непрограммист делится опытом настройки локальной инфраструктуры больших языковых моделей на MacBook M5 Max с 128 ГБ объединённой памяти. Пользователь подробно описывает свой программный стек, выбор моделей и цели изучения ИИ при создании стабильной системы с удалённым доступом.

media Together AI Blog · 13 ч назад

Together AI на ICML 2026: передовые исследования во всех слоях стека

Together AI представляет девять статей на ICML 2026, охватывающих полный стек разработки своей платформы.

lab Hugging Face Blog · 14 ч назад

Hugging Face и Cerebras представляют Gemma 4 для голосового ИИ в реальном времени

Компании Hugging Face и Cerebras интегрировали модель Google Gemma 4 в свои платформы для реализации приложений голосового искусственного интеллекта в реальном времени. Это сотрудничество позволяет разработчикам использовать мультимодальные возможности Gemma 4 для задач обработки аудио с низкой задержкой.

media Together AI Blog · 14 ч назад

Объявляем о привлечении $800 млн в рамках раунда C для ускорения перехода к открытому ИИ

Компания привлекла 800 миллионов долларов в рамках раунда финансирования серии C, направленного на ускорение перехода к искусственному интеллекту с открытым исходным кодом.

lab Hugging Face Blog · 14 ч назад

ScarfBench: Оценка ИИ-агентов для миграции на фреймворки Enterprise Java

В этой статье представлен ScarfBench, бенчмарк, предназначенный для оценки производительности ИИ-агентов при миграции корпоративных приложений Java между различными фреймворками. Исследование подчеркивает сложность миграции фреймворков и предлагает стандартизированный метод оценки возможностей агентов в этой области.

github CrewAI · 16 ч назад

Примечания к выпуску crewAI 1.15.2a1

Выпуск crewAI 1.15.2a1 включает несколько новых функций, исправлений ошибок и обновлений документации для фреймворка оркестрации агентов.

lab Google — The Keyword (AI) · 19 ч назад

Выпуск llama.cpp b9859 добавляет поддержку предварительно скомпилированных ядер OpenCL

Выпуск llama.cpp b9859 вводит возможность загрузки предварительно скомпилированных бинарных ядер из библиотек для OpenCL, специально ориентированных на GPU Adreno. Это обновление также предоставляет бинарные файлы для macOS, Linux, Windows, Android и openEuler для CPU, GPU и различных ускорителей.

lab xAI News · 20 ч назад

xAI запускает конструктор голосовых агентов без кода для Grok Voice

xAI объявила о бета-версии Voice Agent Builder, платформы без кода, предназначенной для настройки голосовых агентов производственного уровня в Grok Voice за две минуты. Этот инструмент позволяет операторам и разработчикам развертывать высоконагруженные голосовые агенты без создания с нуля базовой телекоммуникационной или ИИ-инфраструктуры.

github llama.cpp · 21 ч назад

Выпуск llama.cpp b9858 с исправлением пути к модели HF

Проект llama.cpp выпустил версию b9858, которая включает изменение для использования основного сплита Hugging Face в качестве пути к модели. Это обновление решает проблему #25181, касающуюся путей загрузки моделей.

github llama.cpp · 23 ч назад

Выпуск llama.cpp b9857: переработка Flash Attention и новые бинарники

Выпуск llama.cpp b9857 представляет собой комплексную переработку реализации Hexagon Flash Attention, сфокусированную на оптимизациях и улучшении точности. Это обновление включает значительные изменения в модулях hex-mm и hex-fa, такие как объединение задач квантования с основными потоками умножения матриц (matmul), слияние с операциями ADD и оптимизация обработки масок.

github llama.cpp · 1 д назад

Выпуск llama.cpp b9855 добавляет оптимизацию AVX2 nvfp4 и новые бинарные файлы

Проект llama.cpp выпустил версию b9855, которая вводит оптимизацию AVX2 для скалярного произведения nvfp4 с использованием таблицы поиска (LUT) UE4M3 в бэкенде ggml-cpu.

github llama.cpp · 1 д назад

Выпуск llama.cpp b9856 с CUDA restrict + PDL для FA

Проект llama.cpp выпустил версию b9856, внося последовательное использование ключевого слова `restrict` и PDL для Flash Attention в CUDA. Это обновление сопровождается предварительно собранными бинарными файлами для macOS, Linux, Android, Windows и openEuler на различных аппаратных бэкендах.

github llama.cpp · 1 д назад

Удалить резервный переход PWA для предотвращения кэширования запросов к конечным точкам API

Обновление удаляет механизм резервного перехода Progressive Web App (PWA). Это изменение введено специально для предотвращения непреднамеренного кэширования запросов к конечным точкам API.

github llama.cpp · 1 д назад

Выпуск llama.cpp b9852 добавляет поддержку q1_0 для OpenCL

Проект llama.cpp выпустил версию b9852, в которой представлена начальная поддержка формата квантования q1_0 для OpenCL. Это обновление включает общие возможности q1_0 и специфичные реализации Adreno GEMM/GEMV для устройств OpenCL.

lab Anthropic News · 2 д назад

Anthropic повторно развертывает Fable 5 после экспортных ограничений США

Anthropic восстанавливает глобальный доступ к своим моделям Claude Fable 5 и Mythos 5 после того, как правительство США сняло экспортные ограничения, которые приостановили доступность для всех пользователей. Fable 5 станет доступен глобально с 1 июля на платформе Claude, при этом будут действовать ограничения по использованию до 7 июля, после чего переход к доступу на основе кредитов.

github llama.cpp · 2 д назад

Выпуск llama.cpp b9851 исправляет усечение целых чисел в CUDA и предоставляет бинарные файлы

Проект llama.cpp выпустил версию b9851, которая включает исправление для CUDA, предотвращающее ошибки усечения целых чисел и переполнения в ядре flash_attn_mask_to_KV_max. Это обновление решает проблемы, связанные с шагами маски KQ внутри указанного ядра.

github llama.cpp · 2 д назад

Выпуск llama.cpp b9850: исправления для Qwen3 и новые бинарные файлы

Выпуск llama.cpp b9850 вносит обновления поддержки конкретных моделей, включая регистрацию тензора t_layer_inp для Qwen3Next, исправление назначения входных данных в цикле обработки слоев и устранение проблем DFLASH для qwen-coder-next. Также добавлен тензор для нормализации внимания в модели Qwen3.

github MCP (GitHub org) · 2 д назад

Выпущен MCP Python SDK v2.0.0b1 с полной поддержкой спецификации 2026 года

Python SDK для Model Context Protocol (MCP) выпустила свою первую бета-версию, v2.0.0b1, которая добавляет полную поддержку спецификации MCP от 28 июля 2026 года. Этот предварительный выпуск доступен только по желанию, что гарантирует, что стандартные установки продолжают указывать на стабильную ветку 1.x.

Wmf — новый экспериментальный метод

Локальная LLM на MacBook M5 Pro — я новичок в этом!

Together AI на ICML 2026: передовые исследования во всех слоях стека

Hugging Face и Cerebras представляют Gemma 4 для голосового ИИ в реальном времени

Объявляем о привлечении $800 млн в рамках раунда C для ускорения перехода к открытому ИИ

ScarfBench: Оценка ИИ-агентов для миграции на фреймворки Enterprise Java

Примечания к выпуску crewAI 1.15.2a1

Последние новости ИИ от Google, анонсированные в июне 2026 года

Выпуск llama.cpp b9859 добавляет поддержку предварительно скомпилированных ядер OpenCL

xAI запускает конструктор голосовых агентов без кода для Grok Voice

Выпуск llama.cpp b9858 с исправлением пути к модели HF

Выпуск llama.cpp b9857: переработка Flash Attention и новые бинарники

Выпуск llama.cpp b9855 добавляет оптимизацию AVX2 nvfp4 и новые бинарные файлы

Выпуск llama.cpp b9856 с CUDA restrict + PDL для FA

Удалить резервный переход PWA для предотвращения кэширования запросов к конечным точкам API

Выпуск llama.cpp b9852 добавляет поддержку q1_0 для OpenCL

Anthropic повторно развертывает Fable 5 после экспортных ограничений США

Выпуск llama.cpp b9851 исправляет усечение целых чисел в CUDA и предоставляет бинарные файлы

Выпуск llama.cpp b9850: исправления для Qwen3 и новые бинарные файлы

Выпущен MCP Python SDK v2.0.0b1 с полной поддержкой спецификации 2026 года