Все статьи — korshunov.ai

Все статьи Страница 1 / 130

SupraLabs выпустил модель SupraVL-Nano-900k для обработки изображений и языка

SupraLabs представил модель SupraVL-Nano-900k, полностью прозрачную модель из 900 тысяч параметров, обученную с нуля на наборе Flickr8k. Модель включает в себя CNN-энкодер, декодер стиля GPT-2 и метод объединения с помощью префикса, все компоненты которой полностью документированы и разработаны с целью образовательной ясности.

github llama.cpp · 13 д назад

llama.cpp выпускает b9713 с новыми бинарниками и функциями

llama.cpp выпустил версию b9713, добавив поддержку батчинга в mtmd-cli и тесты на видео. В выпуске представлены бинарники для macOS, Linux, Android, Windows и openEuler на нескольких архитектурах и вариантах ускорения, включая Vulkan, CUDA, OpenVINO и SYCL.

github llama.cpp · 13 д назад

llama.cpp release b9714 добавляет заголовок X-Accel-Buffering и новые бинарники

Версия llama.cpp b9714 добавляет заголовок "X-Accel-Buffering": "no" для потоковых концов, чтобы предотвратить буферизацию ответов Nginx, что решает проблемы потоковой передачи в приложениях, таких как Pi coding harness. В этом выпуске представлены бинарники для macOS, Linux, Android, Windows и openEuler на различных архитектурах и вариантах аппаратного ускорения.

SupraLabs выпустил модель SupraVL-Nano-900k для обработки изображений и языка

llama.cpp выпускает b9713 с новыми бинарниками и функциями

llama.cpp release b9714 добавляет заголовок X-Accel-Buffering и новые бинарники

UFP4: Единая 4-битовая тренировка устраняет смещение сжатия в предварительной тренировке больших языковых моделей

Релиз LLaMA.cpp b9715 добавляет поддержку CUDA Col2Im 1D и бинарные файлы для нескольких платформ

DataMagic превращает таблицы данных в интерактивные видео с анализом данных

NRT-Bench: Многоходовое красное тестирование агентов ЛЛМ в критически важных системах

Многоуровневая децифрация улучшает классификацию вредоносного ПО на основе больших языковых моделей

Внимание-ориентированный глубокий анализ для интерпретируемой классификации морфологии сперматозоидов

Переиспользование классификатора речи для генерации на основе диффузии

Контекстуально-осознанный байесовский модель улучшает прогнозирование успеха ИВФ

Защита от автоматизированных атак на агентные ИИ

UltraQuant: 4-бит кэширование KV для агентов с большим контекстом

Оптимальный порядок в рамке многоагентных систем

Передача предвзятости оценщиков в системах мультиагентных языковых моделей

Калибровка без понимания в обнаружении уязвимостей в LLM

FreeStyle: масштабируемое генерирование двойных ссылок через извлечение сообщественных LoRAs

Как безопасные LLM интерпретируют смешанные демонстрации соблюдения

Эффективная и надежная вероятностная проверка для агентов ИИ

Multi-LCB: Расширение LiveCodeBench до 12 языков программирования