Open weights — korshunov.ai — новости ML

Open weights Страница 1 / 11

Кадровая интеллектуальная рамка для публичной дискуссии в Нигерии

Кадровая интеллектуальная рамка (КИР) вводит девятимерную схему для анализа публичной дискуссии в Нигерии, решая проблему несоответствия контекста в системах искусственного интеллекта. Данные калибровки из 30 пунктов показывают, что схема-ориентированное подсказывание повышает точность классификации регистра с 33,3% до 73,3% и увеличивает общий показатель кадровой интеллектуальности с 73,2 до 78,6.

arxiv arXiv cs.LG · 6 д назад

Критическая перколяция как модель синтетических данных для интерпретируемости

Новый синтетический набор данных, основанный на критических кластерах среднего поля перколяции, предоставляет реалистичную и аналитически обоснованную модель с иерархической структурой. В нём присутствуют редкие, фрактальные кластеры с распределениями размеров по степенному закону и скрытые переменные, генерирующие целевые значения через иерархию таксономии. Нейронные сети могут линейно декодировать эти истинные скрытые переменные из активаций, демонстрируя сильную интерпретируемость.

arxiv arXiv cs.CL · 6 д назад

FineREX: настроенная система извлечения названий и связей для знаний о незаконной транспортировке людей

FineREX — это специализированная система знаний, использующая настроенную модель языковой модели для извлечения названий и связей. Она превосходит общие модели на 15,50% по метрике F1 для сущностей и на 31,46% по метрике F-1 для связей, снижая шум в правовых данных почти вдвое и сокращая дублирование узлов с 17,78% до 11.-17%. Система также сокращает общее время обработки на 50,0% за счёт устранения избыточных шагов.

arxiv arXiv cs.CL · 6 д назад

Семантические кластеры — предобучение Тетслин-машины для интерпретируемости

Новый подход предобучает Тетслин-машину с использованием семантических кластеров из моделей языка, избегая векторных представлений. Метод группирует текстовые образцы в связные кластеры с помощью K-средних или Top2Vec, затем использует пары кластер-образец для обучения неотрицательной Тетслин-машины с обратной связью типа I. Результаты показывают превосходную производительность на пяти наборах данных, соответствующую точности на уровне BERT, при сохранении полной интерпретируемости.

arxiv arXiv cs.CL · 6 д назад

Credence: семантические метрики и анализ сходимости для разбиения утверждений

Credence вводит Semantic-F1, метрику косинусной схожести на основе BGE-large, которая повышает точность разбиения утверждений по сравнению с Jaccard на 15-32 процентных пункта. В работе доказаны теоремы сходимости для восстановления по правилам и на основе LLM: восстановление по правилам является конечным и монотонным, в то время как восстановление на основе LLM требует механизмов раннего выхода. Оценки в социальных медиа, энциклопедических и новостных областях показывают EPR от 0,94 до 1,00, при этом восстановление по правилам снижает нарушения атомарности на 47-100% без потери точности.

arxiv arXiv cs.CL · 6 д назад

LLMs могут обрабатывать непрочитываемый текст с высокой семантической точностью

Большие языковые модели могут поддерживать 99,5% семантической точности при обработке сжатых, непрочитываемых текстовых форм, называемых BabelTele, даже если текст сокращен до 27,9% от его исходной длины. Эти модельные представления показывают сильную производительность в переносе между моделями, в памяти агента и в коммуникации между агентами, что указывает на то, что читаемость для человека не является необходимой для восстановления семантики в LLMs.

arxiv arXiv cs.CL · 6 д назад

AI-Driven Deliberation: Scaling Inclusivity and Empowering Marginalised Groups

Large Language Models могут масштабировать демократическую дискуссию, обеспечивая конструкцию аргументации и снижая лингвистические предвзятости. В главе используется системно-функциональная лингвистика для анализа того, как социально-демографические и коммуникативные вариации влияют на участие, подчеркивая потенциал ИИ в преодолении исключающих норм, при этом предостерегая от чрезмерного или недостаточного утверждения его возможностей. Поднимается необходимость этических мер и дальнейших исследований для обеспечения равного участия с помощью ИИ.

arxiv arXiv cs.CL · 6 д назад

Оптимизация генеративной системы: измерение видимости AI в поиске

Масштабное исследование более 100 000 ответов на запросы ИИ по 100+ брендам выявило трёхуровневую лестницу видимости брендов: глобальные бренды появляются в 73% ответов, средние бренды — в 44%, а узкоспециализированные бренды — лишь в 11%. Генеративные системы в основном цитируют корпоративные веб-сайты, YouTube является лидером среди некорпоративных источников, а лучшие обзоры и списки составляют 21% всех цитирований. Оценка настроения в упоминаниях брендов нестабильна и меняется в шесть раз чаще, чем просто упоминание.

arxiv arXiv cs.CL · 6 д назад

STAGE: Генерация данных с опорой на источник для преобразования текста в JSON

STAGE — это пайплайн, который генерирует обучающие данные текст-в-JSON с использованием языковых моделей для синтеза отчётов и схем JSON, проверенных посредством исходных таблиц. Оценки на STAGE-Eval показывают, что STAGE повышает точность Qwen3-4B с 31,37% до 74,27% и точность значений с 45,46% до 90,69%.

arxiv arXiv cs.CL · 6 д назад

Качество эссе в больших языковых моделях обнаруживается в линейно доступных формах

Исследование показало, что информация о качестве эссе в больших языковых моделях закодирована в линейно доступных формах их скрытых представлений. Эти представления формируются по слоям, остаются стабильными при разных запросах и демонстрируют частичную переносимость при различных запросах на эссе, при этом более длинные эссе всё больше зависят от более глубоких слоёв модели. Исследование выявило конкретные "нейроны оценки эссе", активация которых сильно коррелирует с оценками и может быть изменена при целенаправленных вмешательствах.

arxiv arXiv cs.CL · 6 д назад

Кадровая интеллектуальная рамка для публичного дискурса в Нигерии

Кадровая интеллектуальная рамка (КИР) вводит девятимерную схему для анализа публичного дискурса в Нигерии, решая проблему отсутствия контекста в системах искусственного интеллекта. Данные калибровки из 30 пунктов показывают, что использование схемы при подсказке повышает точность классификации стиля с 33,3% до 73,3% и увеличивает общий показатель кадровой интеллектуальности с 73,2 до 78,6.

media r/LocalLLaMA · 6 д назад

Переиспользование старого узла с несколькими GPU для локальной инференции

Узел оснащен 8 NVIDIA Quadro RTX 6000 GPU с 192 ГБ ОЗУ и 512 ГБ ОЗУ, что позволяет выполнять масштабную локальную инференцию моделей ИИ. Модели, такие как LLaMA-3 или Mistral с 8–13 миллиардами параметров, могут здесь эффективно работать, обеспечивая более быструю, приватную и низкозадержку производительность по сравнению с настройками на одном GPU, что делает его ценным для внутреннего использования.

media r/LocalLLaMA · 6 д назад

Локальная Qwen не хуже Opus, это инструмент с другими возможностями

В статье утверждается, что Local Qwen не уступает Opus, а служит другой цели. Автор подчеркивает, что каждый модель разработан для конкретных задач, и прямое сравнение моделей игнорирует их разные возможности и предназначенные области применения.

media r/LocalLLaMA · 6 д назад

North Mini Code: 4-битная квантование, поддержка Ollama и OpenRouter

Cohere Labs выпустил версию North Mini Code с квантованием на 4 бита на Hugging Face, что сократило её размер до примерно 20 ГБ для локальной работы на устройствах, таких как Mac. Модель теперь поддерживается в Ollama, локальных средах выполнения на базе llama.cpp, и через API OpenRouter, что улучшает доступность для разработчиков.

github llama.cpp · 6 д назад

llama.cpp Release b9703: Обновления и бинарные загрузки

Версия llama.cpp b9703 включает переработку обработки предустановок сервера, удаление поддержки удаленных предустановок HF и устаревших функций. В релизе представлены бинарные файлы для macOS, Linux, Android, Windows и openEuler на разных архитектурах и вариантах ускорения, включая Vulkan, CUDA, OpenVINO и SYCL.

github llama.cpp · 6 д назад

llama.cpp release b9704: fixes invalid grammar handling and adds new binaries

llama.cpp version b9704 теперь возвращает HTTP 400 для недопустимой грамматики вместо тихого игнорирования ограничений. В релизе представлены бинарные файлы для macOS, Linux, Android, Windows и openEuler на разных архитектурах и аппаратных ускорителях, с поддержкой Vulkan, ROCm, OpenVINO, SYCL и CUDA.

media r/LocalLLaMA · 6 д назад

mistral.rs v0.8.10 добавляет поддержку /v1/skills для локальных моделей

mistral.rs v0.8.10 вводит открытую совместимую с OpenAI функцию агентов навыков через конечную точку /v1/skills, позволяющую локальным моделям выполнять инструкции и скрипты в определённых областях без зависимости от API frontier. Обновление поддерживает инструменты, такие как загрузка и скачивание файлов через /v1/files, и включает предварительно скомпилированные бинарники для Linux, macOS и Windows.

media r/LocalLLaMA · 6 д назад

Кадровая интеллектуальная рамка для публичной дискуссии в Нигерии

Критическая перколяция как модель синтетических данных для интерпретируемости

FineREX: настроенная система извлечения названий и связей для знаний о незаконной транспортировке людей

Семантические кластеры — предобучение Тетслин-машины для интерпретируемости

Credence: семантические метрики и анализ сходимости для разбиения утверждений

LLMs могут обрабатывать непрочитываемый текст с высокой семантической точностью

AI-Driven Deliberation: Scaling Inclusivity and Empowering Marginalised Groups

Оптимизация генеративной системы: измерение видимости AI в поиске

STAGE: Генерация данных с опорой на источник для преобразования текста в JSON

Качество эссе в больших языковых моделях обнаруживается в линейно доступных формах

Кадровая интеллектуальная рамка для публичного дискурса в Нигерии

Переиспользование старого узла с несколькими GPU для локальной инференции

Локальная Qwen не хуже Opus, это инструмент с другими возможностями

North Mini Code: 4-битная квантование, поддержка Ollama и OpenRouter

llama.cpp Release b9703: Обновления и бинарные загрузки

llama.cpp release b9704: fixes invalid grammar handling and adds new binaries

mistral.rs v0.8.10 добавляет поддержку /v1/skills для локальных моделей

Бесплатный доступ к инференсу GLM-5.2 на Hugging Face в течение следующих 6 часов

unsloth GLM-5.2-GGUF с 2-битной квантованией на 238 ГБ

GLM-5.2 — лучшая открытая модель креативного письма