Все статьи
media Hugging Face Forums · 9 ч назад

Пользователь запрашивает удаление аккаунта с порнографией, жестокостью и нацистским контентом

Пользователь на форумах Hugging Face просит удалить аккаунт 'cerealpotatochipssea' за публикацию запрещённого контента. В сообщении утверждается, что аккаунт распространял материалы 18+, сцены жестокости и изображения нацистской тематики.

lab OpenAI News · 14 ч назад

OpenAI демонстрирует модели GPT-5.6 Sol, Terra и Luna

OpenAI запустила ограниченный предпросмотр серии GPT-5.6, представив три новые модели: Sol как флагманскую, Terra для сбалансированной повседневной работы и Luna для быстрых и доступных задач. Компания планирует сделать эти модели общедоступными в ближайшие недели после этого начального этапа с доверенными партнерами.

github llama.cpp · 15 ч назад

Выпуск llama.cpp b9821: флаги CLI и мультиплатформенные бинарники

Проект llama.cpp выпустил версию b9821, которая вносит обновления в интерфейс командной строки, позволяя пользователям вызывать флаги --version, --licenses и --help. Этот выпуск предоставляет полный набор предварительно собранных бинарных файлов для macOS, Linux, Android, Windows и openEuler на различных аппаратных ускорителях.

media Hugging Face Forums · 16 ч назад

Задача: Создать систему RAG для исчезающего разговорного языка

Вакансия ищет опытного инженера по NLP или LLM для разработки первого движка локализации на основе Retrieval-Augmented Generation (RAG) для малообеспеченного языка, на котором говорят в Южной Америке. Проект использует проприетарный корпус педагогического контента и словарных данных, разработанный за четыре года.

github llama.cpp · 18 ч назад

Выпуск llama.cpp b9820: уменьшено количество синхронизаций CUDA и новые бинарные файлы

Выпуск llama.cpp b9820 вносит улучшения производительности за счёт повторного введения меньшего количества синхронизаций при разделённых вычислениях, ориентированных на бэкенды CUDA. Это обновление также предоставляет предварительно собранные бинарные файлы для macOS, Linux, Windows, Android и openEuler для процессоров, графических ускорителей и специализированных аппаратных ускорителей.

github llama.cpp · 19 ч назад

Выпуск llama.cpp b9816: синхронизация с ggml и новые бинарные файлы

Проект llama.cpp выпустил версию b9816, которая включает синхронизацию с библиотекой ggml. Это обновление предоставляет предварительно собранные бинарные файлы для платформ macOS, iOS, Linux, Windows, Android и openEuler.

github llama.cpp · 20 ч назад

Выпуск llama.cpp b9817: обновление OpenVINO до версии 2026.2.1 и улучшения операторов

Выпуск llama.cpp b9817 обновляет бэкенд OpenVINO до версии 2026.2.1 и делает его релизные пакеты самодостаточными. Это обновление включает несколько улучшений операторов внутри бэкенда OpenVINO, таких как удаление жёстко заданных наборов compute_op_type и включение softmax с поддержкой sink input.

github llama.cpp · 21 ч назад

Релиз llama.cpp b9813 добавляет поддержку Intel Xe-LPG Plus через Vulkan

Релиз llama.cpp b9813 внедряет поддержку Vulkan для оборудования Intel Xe-LPG Plus путем добавления перечисления архитектуры INTEL_XE1 и включения coopmat1. Это обновление устраняет предыдущие комментарии в коде, переименовывает идентификатор архитектуры и включает проверку драйверов Windows.

github llama.cpp · 21 ч назад

Выпуск llama.cpp b9814 с оптимизацией Vulkan для mi50

Проект llama.cpp выпустил версию b9814, которая включает оптимизацию операции `mul_mat_vecq` в Vulkan, специально направленную на графический процессор AMD mi50. Это обновление сопровождается полным набором предварительно собранных бинарных файлов для нескольких операционных систем и аппаратных архитектур.

media Hugging Face Forums · 22 ч назад

Пользователь сообщает, что статья проиндексирована, но отсутствует в разделе Daily Papers

Пользователь на форуме Hugging Face сообщает, что его статья из arXiv «Agent-as-a-Router: Agentic Model Routing for Coding Tasks» была успешно проиндексирована и подтверждена автором, но так и не появилась на главной странице раздела Daily Papers. Несмотря на получение голосов поддержки от сообщества и привязку соответствующего набора данных, статья не была опубликована в течение нескольких дней.

github llama.cpp · 23 ч назад

Выпуск llama.cpp b9811 с обходным путём для компилятора Vulkan

Проект llama.cpp выпустил версию b9811, которая включает исправление ошибки компилятора, влияющей на путь conv2d coopmat2 в Vulkan. Этот обходной путь также применён к реализации CONV_3D на основе рекомендаций инженера NVIDIA Джеффа Болца.

github llama.cpp · 1 д назад

Выпуск llama.cpp b9810 добавляет отображение cublasSgemmBatched и новые бинарные файлы

Проект llama.cpp выпустил версию b9810, внедряющую отображение CUDA для `cublasSgemmBatched` в заголовках вендоров HIP/MUSA. Это обновление сопровождается комплексным набором предварительно собранных бинарных файлов для платформ macOS, Linux, Windows, Android и openEuler.

media Hugging Face Forums · 1 д назад

Pendo нанимает Staff и Senior AI-инженеров в Нью-Йорке для работы над Novus

Pendo проводит очный набор Staff и Senior AI-инженеров в Нью-Йорке для работы над Novus — продуктовым агентом производственного уровня, способным автономно читать живые кодовые базы и выявлять реальные проблемы пользователей.

media Hugging Face Forums · 1 д назад

eBPF в Go: наблюдаемость для сервисов, сгенерированных ИИ

В этой статье представлен учебник по использованию eBPF с Go для достижения наблюдаемости на уровне ядра, что решает проблему отсутствия видимости при отладке проблем в сервисах, сгенерированных ИИ.