API & product launches
media Hugging Face Forums · 2 ч назад

Пользователи сообщают о недоступности инструментов и MCP-сервера для Step 3.7 Flash в HuggingChat

Пользователь на форумах Hugging Face сообщил, что модель Step 3.7 Flash утратила возможность использовать инструменты и подключаться к MCP-серверам, начиная с того утра. Автор поста выразил высокую удовлетворённость производительностью модели, отметив её высокое качество в соотношении с низким потреблением ресурсов и стоимостью. Он подчеркнул желание продолжать использовать именно эту модель, а не переключаться на альтернативы, из-за её эффективности. Пользователь прямо спросил, является ли эта потеря функциональности постоянной и можно ли предпринять какие-либо шаги для восстановления доступа. Пост отражает обеспокоенность сообщества внезапным нарушением работы инструментов для популярной и экономичной модели.

blog Simon Willison · 4 ч назад

Саймон Уиллисон преобразует данные о совместимости браузеров MDN в базу данных SQLite

Вдохновлённый новым сервисом MDN MCP от Mozilla, Саймон Уиллисон преобразовал обширный репозиторий mdn/browser-compat-data в базу данных SQLite. Проект использует скрипт, сгенерированный Claude Code for web (Opus 4.8), для выполнения этого преобразования с помощью sqlite-utils. Полученная база данных имеет размер около 66 МБ и размещена на GitHub с открытыми заголовками CORS для обеспечения прямого доступа. Для автоматизации процесса был создан рабочий процесс GitHub Actions, разработанный с помощью Codex Desktop (GPT-5.5), который принудительно отправляет обновлённую базу данных в пустую ветку под названием db. Пользователи могут скачать финальный файл browser-compat.db напрямую из репозитория или изучить его содержимое через Datasette Lite.

media Hugging Face Forums · 5 ч назад

Пользователи сообщают о сбое доступа к инструменту Flash модели Step 3.7 в HuggingChat

Пользователь на форуме обсуждений Hugging Face сообщил, что модель Step 3.7 Flash от StepFun AI потеряла возможность использовать инструменты, включая серверы MCP, начиная с утра момента публикации сообщения. Автор выразил обеспокоенность тем, является ли этот сбой временным или постоянным, отметив свою сильную предпочтительность к данной конкретной модели из-за её высокой производительности и низких затрат ресурсов по сравнению с конкурентами. Несмотря на высокую оценку качества и доступности модели, пользователь подчеркнул немедленные проблемы, вызванные невозможностью выполнения функций, основанных на использовании инструментов. Сообщение призывает сообщество поделиться опытом решения подобных проблем и предложить возможные пути устранения неполадки. Этот инцидент подчеркивает критическую зависимость пользователей от доступности инструментов при использовании данной конкретной конфигурации ИИ.

github LlamaIndex · 6 ч назад

Примечания к выпуску Llama Index v0.14.23

Llama Index выпустила версию 0.14.23 24 июня 2026 года, добавив значительные мультимодальные возможности и различные исправления ошибок. Основное обновление включает функции мультимодального синтеза и внедрение мультимодальных механизмов запросов для поддержки разнообразных типов данных. Ключевые исправления касаются обработки блоков документов и видео в выводах FunctionTool, а также обеспечения корректного сохранения блоков памяти, основанных на URL. Улучшения производительности были реализованы за счет использования множеств для дедупликации внутри пакетов в конвейере загрузки и оптимизации логики разделения текста на токены. Выпуск также устраняет ZeroDivisionError при пустых входных последовательностях и исправляет ошибки рекурсии в сплиттерах, когда единицы превышают размеры чанков. Кроме того, в операции ввода-вывода файлов добавлено явное кодирование UTF-8, а глубокое копирование начальных состояний предотвращает утечку мутаций между запусками рабочих процессов.

lab Claude Code Releases · 6 ч назад

Примечания к выпуску Claude Code v2.1.191

Версия Claude Code 2.1.191 добавляет поддержку команды /rewind, позволяя пользователям возобновлять разговоры с момента до выполнения команды /clear. Обновление устраняет несколько критических проблем, включая повторное появление фоновых агентов после их остановки и скачки позиции прокрутки во время потоковой передачи ответов. Также исправлено поведение, при котором команда /voice отображала общие сообщения об ошибках, а URL-адреса для /login усечались в Windows Terminal. Значительные улучшения повышают надёжность работы с MCP-серверами за счёт добавления логики повторных попыток при временных сетевых ошибках во время обнаружения возможностей и потоков OAuth. В безголовых средах теперь пропускаются всплывающие окна браузера для OAuth, а разрешения сети для песочницы запоминаются на протяжении всей сессии. Оптимизации производительности снижают использование процессора во время потоковой передачи примерно на 37% за счёт объединения обновлений текста и предотвращают рост потребления памяти при длительных сессиях из-за кэша вывода терминала.

media r/LocalLLaMA · 10 ч назад

Я разработал Windows Copilot в виде бесплатной OpenAI-совместимой API

Пользователь создал локальную API, которая имитирует функциональность GPT-4, совместимую с OpenAI, используя бесплатный сервис Microsoft Copilot. Инструмент авторизуется в аккаунте Microsoft один раз, работает локально на устройстве Windows и предоставляет сервер по адресу http://localhost:8000/v1, поддерживающий потоковые и многократные диалоги без необходимости API-ключа или оплаты. Инструмент предназначен для личного и образовательного использования и доступен по ссылке https://github.com/sums001/Windows-Copilot-API.

lab Mistral AI News · 14 ч назад

Новые элементы управления для безопасности и доступа в корпоративной среде

Mistral Studio теперь предлагает расширенные элементы управления для администрирования доступа к соединителям в зависимости от рабочей области и инструмента, что позволяет настроить детальные разрешения. В функционале представлены ключи API с областями, соединители для нескольких аккаунтов и новый Connectors Debugger для анализа причин сбоев, все это обеспечивает безопасные и аудитуемые интеграции с корпоративными системами.

media r/LocalLLaMA · 1 д назад

Выпущен открытый исходный приложение Hugging Face для загрузки

Разработчик выпустил открытый исходный десктоп-приложение, которое загружает модели, датасеты и пространства Hugging Face локально. Приложение автоматически обнаруживает проблемы соединения и продолжает загрузку, работает без облачных сервисов и сбора данных о пользователе, и поддерживает macOS, Windows и Linux (оба x64 и arm64).

media Hugging Face Forums · 1 д назад

Доступ к API Llama 3.1 70B ограничен для тестеров Hugging Face

Пользователи могут получить доступ к модели Llama 3.1 70B через тестер Hugging Face, однако при использовании сторонних приложений или curl появляется ошибка "Модель не поддерживается поставщиком". Модель в настоящее время доступна только через интерфейс Hugging Face и не предоставляется через публичные API-конечные точки.

media Hugging Face Forums · 1 д назад

Токены Spaces больше не работают и файлы не сохраняются

После недавнего обновления Hugging Face токены Spaces перестали работать, что привело к ошибкам 404 при попытке сохранить сгенерированные файлы. Процесс успешно завершается до 100%, но на этапе сохранения возникают ошибки токенов, что приводит к расходу кредитов ZeroGPU без создания сохранённых результатов.

lab Hugging Face Blog · 2 д назад

Доставка huggingface_hub еженедельно с ИИ, открытыми инструментами и человеческим контролем

Hugging Face представляет huggingface_hub еженедельно, интегрируя ИИ-модели, открытые инструменты и процесс человеческого ревью для обеспечения качества и безопасности. Обновление подчеркивает прозрачность, вовлечение сообщества и ответственное развитие ИИ через постоянную проверку с участием человека.

lab OpenAI News · 4 д назад

OpenAI запускает контроль расходов и аналитику использования для ChatGPT Enterprise

OpenAI представил новые средства контроля расходов и аналитику использования для ChatGPT Enterprise. Эти функции помогают компаниям управлять расходами и принимать обоснованные решения при масштабировании использования ИИ.

media r/LocalLLaMA · 4 д назад

Что делают люди с локальными моделями и какие инструменты они используют?

Пользователь спрашивает о практическом применении локальных моделей и о том, какие инструменты эффективны для задач, таких как программирование, особенно в качестве альтернативы веб-интерфейсам, таким как Claude.ai. Они упоминают попытку использования OpenWebUI, но отмечают, что он недостаточно мощен без значительной настройки.

media r/LocalLLaMA · 4 д назад

Введение в Noema Atlas: распределение моделей на основе пир-топ-пир

Noema Atlas — это бесплатная, открытая система пир-топ-пир, которая обеспечивает децентрализованное распространение локальных моделей больших языковых моделей с использованием Iroh и хеширования BLAKE3. Она позволяет пользователям делиться и получать модели напрямую с узлов по всему миру, с Hugging Face и зеркал как резервные варианты, и поддерживает восстановление моделей, удалённых с Hugging Face, через приватное распространение.

github llama.cpp · 5 д назад

llama.cpp release b9738: fixes CORS auth header forwarding and new binary builds

llama.cpp version b9738 исправляет прокси CORS для предотвращения передачи аутентификационных заголовков. В выпуске представлены бинарные сборки для macOS, Linux, Android, Windows и openEuler на разных архитектурах и вариантах ускорения, включая Vulkan, CUDA, OpenVINO и SYCL.

github llama.cpp · 5 д назад

ggml оптимизирует AMX с помощью плоской обработки разделов

Проект ggml повысил производительность AMX за счёт плоской обработки разделов по n_batch * M, обеспечивая участие всех потоков в квантовании. Данное изменение обеспечивает ускорение на 1,47 раза при различных моделях и конфигурациях аппаратуры на платформах CPU и GPU, при этом результаты демонстрируют стабильное сокращение времени инференса.

media r/LocalLLaMA · 5 д назад

Выпущена самая большая в мире база данных заголовков чатов от SupraLabs

SupraLabs выпустил отобранный набор заголовков чатов с 115 тысячами образцов, превысив предыдущий рекорд в 10 тысячах образцов. Отфильтрованная база данных доступна как "SupraLabs/chat-titles-filtered-115K", а также предоставляется неотфильтрованная версия с 150 тысячами образцов, а также устаревшая база данных из 12 тысяч образцов.