Все статьи
github llama.cpp · 18 ч назад

Выпуск llama.cpp b9820: уменьшено количество синхронизаций CUDA и новые бинарные файлы

Выпуск llama.cpp b9820 вносит улучшения производительности за счёт повторного введения меньшего количества синхронизаций при разделённых вычислениях, ориентированных на бэкенды CUDA. Это обновление также предоставляет предварительно собранные бинарные файлы для macOS, Linux, Windows, Android и openEuler для процессоров, графических ускорителей и специализированных аппаратных ускорителей.

github llama.cpp · 19 ч назад

Выпуск llama.cpp b9816: синхронизация с ggml и новые бинарные файлы

Проект llama.cpp выпустил версию b9816, которая включает синхронизацию с библиотекой ggml. Это обновление предоставляет предварительно собранные бинарные файлы для платформ macOS, iOS, Linux, Windows, Android и openEuler.

github llama.cpp · 20 ч назад

Выпуск llama.cpp b9817: обновление OpenVINO до версии 2026.2.1 и улучшения операторов

Выпуск llama.cpp b9817 обновляет бэкенд OpenVINO до версии 2026.2.1 и делает его релизные пакеты самодостаточными. Это обновление включает несколько улучшений операторов внутри бэкенда OpenVINO, таких как удаление жёстко заданных наборов compute_op_type и включение softmax с поддержкой sink input.

github llama.cpp · 21 ч назад

Релиз llama.cpp b9813 добавляет поддержку Intel Xe-LPG Plus через Vulkan

Релиз llama.cpp b9813 внедряет поддержку Vulkan для оборудования Intel Xe-LPG Plus путем добавления перечисления архитектуры INTEL_XE1 и включения coopmat1. Это обновление устраняет предыдущие комментарии в коде, переименовывает идентификатор архитектуры и включает проверку драйверов Windows.

github llama.cpp · 21 ч назад

Выпуск llama.cpp b9814 с оптимизацией Vulkan для mi50

Проект llama.cpp выпустил версию b9814, которая включает оптимизацию операции `mul_mat_vecq` в Vulkan, специально направленную на графический процессор AMD mi50. Это обновление сопровождается полным набором предварительно собранных бинарных файлов для нескольких операционных систем и аппаратных архитектур.

media Hugging Face Forums · 22 ч назад

Пользователь сообщает, что статья проиндексирована, но отсутствует в разделе Daily Papers

Пользователь на форуме Hugging Face сообщает, что его статья из arXiv «Agent-as-a-Router: Agentic Model Routing for Coding Tasks» была успешно проиндексирована и подтверждена автором, но так и не появилась на главной странице раздела Daily Papers. Несмотря на получение голосов поддержки от сообщества и привязку соответствующего набора данных, статья не была опубликована в течение нескольких дней.

github llama.cpp · 23 ч назад

Выпуск llama.cpp b9811 с обходным путём для компилятора Vulkan

Проект llama.cpp выпустил версию b9811, которая включает исправление ошибки компилятора, влияющей на путь conv2d coopmat2 в Vulkan. Этот обходной путь также применён к реализации CONV_3D на основе рекомендаций инженера NVIDIA Джеффа Болца.

github llama.cpp · 1 д назад

Выпуск llama.cpp b9810 добавляет отображение cublasSgemmBatched и новые бинарные файлы

Проект llama.cpp выпустил версию b9810, внедряющую отображение CUDA для `cublasSgemmBatched` в заголовках вендоров HIP/MUSA. Это обновление сопровождается комплексным набором предварительно собранных бинарных файлов для платформ macOS, Linux, Windows, Android и openEuler.

media Hugging Face Forums · 1 д назад

Pendo нанимает Staff и Senior AI-инженеров в Нью-Йорке для работы над Novus

Pendo проводит очный набор Staff и Senior AI-инженеров в Нью-Йорке для работы над Novus — продуктовым агентом производственного уровня, способным автономно читать живые кодовые базы и выявлять реальные проблемы пользователей.

media Hugging Face Forums · 1 д назад

eBPF в Go: наблюдаемость для сервисов, сгенерированных ИИ

В этой статье представлен учебник по использованию eBPF с Go для достижения наблюдаемости на уровне ядра, что решает проблему отсутствия видимости при отладке проблем в сервисах, сгенерированных ИИ.

github llama.cpp · 1 д назад

Выпуск llama.cpp b9804: исправления для Mamba2 и новые бинарные файлы

Выпуск llama.cpp b9804 вносит исправление для архитектуры Mamba2, удаляя жёстко заданный коэффициент расширения 2x и некорректную проверку параметров, что позволяет поддерживать любое значение expand. Это изменение обновляет скрипт `convert_hf_to_gguf.py`, делая параметр expand необязательным со значением по умолчанию 2.

media Hugging Face Forums · 1 д назад

JoeBro: нативное рабочее пространство для ИИ на macOS без зависимостей

JoeBro — это локальное приложение для macOS, разработанное с упором на первичность локального использования, предназначенное для предоставления рабочего пространства для ИИ без необходимости установки внешних зависимостей, таких как pip или Docker. Оно включает встроенный бэкенд на Python и хранилище SQLite, чтобы гарантировать сохранение всех данных на устройстве пользователя, исключая необходимость в телеметрии и учётных записях.

media Hugging Face Forums · 1 д назад

Как добавить кого-то в датасет/базу данных Hugging Face?

Предоставленный исходный контент указывает на то, что тема первоначального поста была удалена автором. Следовательно, в этом отрывке отсутствует какая-либо конкретная информация о процессе добавления пользователей в датасет или базу данных Hugging Face.

github llama.cpp · 1 д назад

Релиз llama.cpp b9803 с исправлением профилирования OpenCL

Проект llama.cpp выпустил версию b9803, которая включает исправление для OpenCL, обеспечивающее сброс пакетов профилирования при завершении работы для незавершённых пакетов. Это обновление предоставляет бинарные файлы для macOS, Linux, Windows, Android и openEuler для различных аппаратных бэкендов.