Все статьи
github llama.cpp · 10 д назад

llama.cpp выпускает версию b9748 с новыми бинарниками и функциями

llama.cpp выпускает версию b9748, добавляя поле "verbose" в свою схему и предоставляя бинарники для macOS, Linux, Android, Windows и openEuler. В релизе включены поддержка CPU, Vulkan, OpenVINO, SYCL и ROCm на нескольких архитектурах, с доступными билдами для iOS и Windows на CUDA и Vulkan.

media r/LocalLLaMA · 10 д назад

Я предобучил и постобучил 500M параметровую модель LLM и 330M параметровую генератор изображений с нуля

Автор предобучил модель языка на 500M параметров и генератор изображений на 330M параметров с нуля, используя 40B токенов из fineweb. Генератор изображений был вдохновлён архитектурой DreamLite от ByteDance и обучался на смеси датасетов из MidJourney, Flux и CCW3.

media r/LocalLLaMA · 10 д назад

Какой ваш локальный аналог Haiku?

Пользователь ищет надежный и быстрый локальный аналог Haiku для суммирования технического содержимого, такого как документация по коду и описания архитектуры. Он просит рекомендации по подходящим инструментам или моделям в этой области.

media TLDR AI · 10 д назад

GPT-5.6, артефакты Claude Code, представленная память Brain от Perplexity

OpenAI объявил о выпуске GPT-5.6, новой версии языкового модели. Anthropic выпустил артефакты Claude Code, улучшающие возможности генерации кода. Perplexity представил память Brain, позволяющую возвращать контекст в ответах на запросы.

media Hugging Face Forums · 10 д назад

Запрос на принудительное удаление застрявшего пространства Hugging Face

Пользователь просит принудительное удаление пространства Hugging Face "kayinda/rxsteward", застрявшего в состоянии "Building". Все попытки удаления завершаются ошибками 403 или ошибками 400 невалидного ввода, что препятствует повторному использованию имени.

media AI News (smol.ai) · 10 д назад

Разрыв и прогресс открытия моделей GLM-5.2

Модель GLM-5.2 от Zhipu стала лучшей открытым весами, похвалена за свою производительность, приближенную к передовым, в повседневном использовании, с улучшением в задачах программирования и сокращением стоимости инференса на 1 млн токенов за счёт IndexShare. Она превзошла другие открытые модели в тестах по агентским задачам, достигнув 1266 Elo в тесте AA-Briefcase от Artificial Analysis, хотя только 3% задач были полностью выполнены лучшими моделями, что указывает на сохраняющиеся трудности в реальных долгосрочных агентских задачах.

lab NVIDIA Technical Blog · 10 д назад

Создайте собственный фундаментальную модель транзакций для финансовой интеллектуальности

Данные транзакций отражают богатые паттерны поведения человека и являются ключевым активом для предприятий. Текущие сценарии использования часто опираются на уязвимые, вручную разработанные признаки, которые не способны отражать последовательное поведение клиентов в истории транзакций.

lab Hugging Face Blog · 10 д назад

Можно ли победить LoRA при мелком настройке?

Новое исследование рассматривает альтернативы LoRA, наиболее популярному методу мелкой настройки, оценивая, могут ли другие подходы обеспечить лучшие результаты с меньшими вычислительными затратами. Исследование показывает, что хотя некоторые подходы показывают перспективы, ни один из них не демонстрирует стабильного превосходства над LoRA при различных задачах и наборах данных.

media Hugging Face Forums · 10 д назад

Важное открытие для всех, кто застрял на статусе 'Запуск'

Пользовательский интерфейс Hugging Face неправильно отображает пространства, застрявшие на статусе 'Запуск', при этом операции на бэкенде успешно завершаются. Проверка логов контейнеров показывает успешную инициализацию, что указывает на сбой синхронизации на уровне фронтенда. Пользователи не должны изменять свой код; проблема — баг на стороне платформы.

lab Google — The Keyword (AI) · 10 д назад

Новое исследование показывает, что AMIE соответствует врачам по управлению болезнями

Исследование, опубликованное в Nature, показывает, что AMIE, разговорная система искусственного интеллекта, работает так же хорошо, как врач-терапевт при управлении сложными медицинскими состояниями.

media AI News (smol.ai) · 10 д назад

GLM-5.2 появляется как ведущая модель открытого веса для кодирования

GLM-5.2 широко считается первой моделью открытого веса, которая конкурирует с передовыми моделями, такими как Opus 4.8 и GPT-5.5, по своим возможностям. Практикующие отмечают сильное использование инструментов, долгосрочное планирование и поведение автономных подагентов, и консенсус о том, что модель теперь действительно функционирует в передовой области SWE. Появление модели подчеркивает растущую ценность открытых весов для конкуренции поставщиков, развертывания на локальных серверах и снижения зависимости от поставщиков.

lab Hugging Face Blog · 10 д назад

MosaicLeaks: Может ли ваш исследовательский агент сохранять секрет?

MosaicLeaks опубликовал отчёт, в котором поднимается вопрос о том, способны ли исследовательские агенты надёжно сохранять конфиденциальность. Отчёт указывает на опасения по поводу раскрытия данных и доверия к ИИ-ориентированным исследовательским инструментам. В нём призывает к более сильным мерам защиты конфиденциальности и прозрачности в том, как такие агенты обрабатывают чувствительную информацию.

lab NVIDIA Technical Blog · 10 д назад

NVIDIA представляет XR AI для AR-окularов и носимых устройств

NVIDIA представляет XR AI для устранения разрыва в инфраструктуре для разработчиков, создающих AI-опыты на AR-окулярных и XR-устройствах. Решение позволяет интегрировать потоки данных с датчиков в реальном времени, многомодальные ИИ-модели и корпоративные данные в специализированные среды выполнения устройств, упрощая разработку ИИ-агентов для носимых устройств.

lab Google DeepMind Blog · 10 д назад

Правительство Великобритании и Google DeepMind запустили прототип планирования жилья на основе искусственного интеллекта

Правительство Великобритании сотрудничает с Google DeepMind для разработки прототипа на основе искусственного интеллекта, направленного на ускорение процесса принятия решений по планированию жилья. Инициатива направлена на упрощение процесса строительства домов за счёт использования искусственного интеллекта для повышения эффективности принятия решений.

lab OpenAI News · 10 д назад

OpenAI запускает контроль расходов и аналитику использования для ChatGPT Enterprise

OpenAI представил новые средства контроля расходов и аналитику использования для ChatGPT Enterprise. Эти функции помогают компаниям управлять расходами и принимать обоснованные решения при масштабировании использования ИИ.

media Latent Space · 10 д назад

Исключительно: скидка 250 долларов на билеты на конференцию AI Engineer до понедельника

Подписчики LS могут получить скидку в размере 250 долларов на билеты на конференцию AI Engineer. Предложение было ранее объявлено в AINews и доступно для тех, кто выбрал получение уведомлений от AINews.

media r/LocalLLaMA · 10 д назад

2× Radeon R9700 с моделью Qwen 3.6 27B Q8 MTP на llama.cpp

Пользователь сообщает о запуске модели Qwen 3.6 27B MTP на двух GPU Radeon R9700 через llama.cpp с использованием ROCm 7.2.1. Проверки показывают стабильные скорости декодирования (40–67 t/s) и пропускную способность предварительной обработки (до 1500 t/s для промптов длиной менее 10 тысяч токенов), при этом коэффициенты принятия проектов MTP варьируются от 0.33 до 0.61.