Все статьи
media r/LocalLLaMA · 3 ч назад

OpenLumara теперь соединяет любой UI с локальными моделями через endpoint OpenAI

Фреймворк с открытым исходным кодом OpenLumara теперь поддерживает подключение к любому пользовательскому интерфейсу, способному взаимодействовать с endpoint OpenAI, таким как KoboldLite и OpenWebUI. Это обновление позволяет пользователям интегрировать эффективный по количеству токенов инструмент в свои существующие рабочие процессы без изменения предпочитаемого фронтенда.

media r/LocalLLaMA · 3 ч назад

Кто-нибудь использует локальные LLM для крупномасштабной генерации пространственных данных или планировки городов в таком ПО, как QGIS?

Пользователь ищет рекомендации по локальным языковым моделям, способным генерировать крупномасштабные структурные данные, такие как планировка целых городов, дорожные сети и сложные сетевые структуры.

blog Simon Willison · 5 ч назад

Использование DSPy для оценки и улучшения системных промптов SQL агента Datasette

Саймон Уиллисон использовал Claude Code с моделью Fable 5 для автоматизации оценки и оптимизации системных промптов для агента Datasette, конкретно направив усилия на функцию выполнения запросов SQL только для чтения. Процесс включал установку последней альфа-версии Datasette и DSPy для выявления слабых мест в том, как агент обрабатывает информацию о схеме.

media r/LocalLLaMA · 6 ч назад

Локальные бенчмарки на RTX 3090 — Qwen3.6 27b против Ornith

Пользователь сравнил Qwen3.6 27b, Gemma4 26B A4B QAT и Ornith1.0 35B MoE с помощью фреймворка inspect-ai на RTX 3090 для оценки производительности локальных моделей. Тестирование выявило смешанные результаты по общим знаниям, grounding (привязке к контексту) и бенчмаркам программирования, при этом Qwen3.6 в целом лидировал по баллам, а Ornith показал сильные стороны в таких областях, как DROP.

media Hugging Face Forums · 7 ч назад

Эпистемический стресс-тест — Claude Sonnet 5 проверен MarCognity-AI

В статье описывается проверка Claude Sonnet 5 с использованием Skeptical Agent от MarCognity-AI для выявления разрыва между текстовой уверенностью и фактической проверяемостью, называемого «эпистемическим разломом».

media Hugging Face Forums · 7 ч назад

Фреймворк Aiywin предлагает спиральную рекурсию для рассуждений ИИ

Независимый разработчик Aiywin.ai представляет когнитивный фреймворк, который заменяет стандартную линейную обработку на циклы спиральной рекурсии для обработки аномалий и неполных данных. Система математически расширяет контекстные параметры до нахождения структурированного решения, вместо того чтобы останавливаться или галлюцинировать.

media Hugging Face Forums · 8 ч назад

Соло и бенчмаркинг MoA на множестве задач

В статье представлены результаты бенчмарков, сравнивающие отдельные модели с конфигурациями Mixture-of-Agents (MoA) по шести задачам: Bug, Tool, Arch, Clinical, DLQ и общий средний балл. Для оценки использовался Hermes Agent v0.18, а оценки генерировались ChatGPT 5.5 и Claude opus 4.8 на основе рубрики, учитывающей Correctness, Completeness, Depth, Actionability, Clarity и Trust.

media r/LocalLLaMA · 8 ч назад

Пользователь запрашивает модели компьютерного зрения для обнаружения огня или дыма

Пользователь Reddit ищет рекомендации по моделям компьютерного зрения, способным обнаруживать огонь или дым, в частности в контексте мониторинга тлеющих остатков в период сезона фейерверков 4 июля.

media r/LocalLLaMA · 9 ч назад

Анализ 2,3 тыс. локальных ИИ-приложений выявил 82 категории и разнообразные сценарии использования

Анализ Mac App Store выявил 2 259 локальных ИИ-приложений из более чем 20 000 проанализированных записей, подчеркивая растущую экосистему нишевых инструментов, которые упаковывают модели с конкретными рабочими процессами. Обзор охватывает 82 различные категории, от общих задач, таких как транскрипция и OCR, до специализированных функций, таких как стилизация гардероба и помощь в здоровье питомцев.

media r/LocalLLaMA · 10 ч назад

Дообученная Gemma-4-31B для копирайтинга: +290 Elo на EqBench3

Пользователь выпустил узкую дообученную версию модели Gemma-4-31B-it, специально оптимизированную для задач копирайтинга и творческого письма. Модель обучена устранять шаблонные маркетинговые клише и использовать стиль прямого отклика, характеризующийся конкретными деталями и четкими призывами к действию.

media r/LocalLLaMA · 12 ч назад

Агенты совместно пишут масштабную вики по RL для LLM (уже более 200 статей), и любой может присоединиться

Идет совместный проект, в котором ИИ-агенты составляют комплексную вики по обучению с подкреплением для больших языковых моделей, уже обработав более 200 научных статей.

media r/LocalLLaMA · 12 ч назад

Пост в Reddit с призывом ценить разработчиков открытого исходного кода

Пользователь Reddit подчеркивает критическую необходимость благодарности вкладчикам в проекты с открытым исходным кодом, приводя недавние быстрые обновления vLLM как яркий пример усилий сообщества.

media r/LocalLLaMA · 12 ч назад

Пересборка Gemma 4 31b... лучше... Как 26b...

Разработчик излагает план пересборки модели Gemma 4 31B путем снижения количества параметров до примерно 26B с целью улучшения производительности. Проект включает архитектурные изменения, специфические методы обучения и курирование датасетов для создания более компактной и эффективной модели.