Все статьи — korshunov.ai — новости ML

Все статьи

Свежие 1753 →

github только что

Выпуск llama.cpp b9786 добавляет поддержку неконгруэнтных строк через OpenCL

arxiv только что

BITEMBED: Экстремально низкоразрядная архитектура для текстовых эмбеддингов на основе LLM

arxiv только что

Фреймворк оценивает, когда необходимы GraphRAG и агентный RAG

arxiv только что

RAS: Измерение безопасности LLM через согласование с отказом

arxiv только что

TRACE: Легковесное обнаружение отравления корпуса в RAG с помощью атрибуции влияния токенов

+1748 ещё

Inference efficiency 174 →

arxiv только что

BITEMBED: Экстремально низкоразрядная архитектура для текстовых эмбеддингов на основе LLM

github 1 ч назад

Выпуск llama.cpp b9785 с усиленной проверкой флагов и бинарными файлами для нескольких платформ

media 2 ч назад

Выпущены несексуризированные сбалансированные Gemma4-26B-A4B и 31B-QAT со ускорением за счёт MTP

+171 ещё

Research paper 273 →

arxiv только что

BITEMBED: Экстремально низкоразрядная архитектура для текстовых эмбеддингов на основе LLM

arxiv 1 ч назад

Экономия пространства при генерации языка в пределе

arxiv 1 ч назад

SARA: Раскрытие многоязычных знаний в смеси экспертов через семантически закрепленную маршрутизацию

+270 ещё

Safety & alignment 194 →

arxiv только что

RAS: Измерение безопасности LLM через согласование с отказом

arxiv только что

TRACE: Легковесное обнаружение отравления корпуса в RAG с помощью атрибуции влияния токенов

arxiv только что

Хватает ли только энкодеров? Систематическое сравнение судей безопасности на основе энкодеров и декодеров для adversarial-оценки больших языковых моделей

+191 ещё

Retrieval & RAG 39 →

arxiv только что

TRACE: Легковесное обнаружение отравления корпуса в RAG с помощью атрибуции влияния токенов

arxiv 1 ч назад

Как большие языковые модели формируют репутацию брендов в разных языках и рынках

media 5 ч назад

Онтологическая инверсия: переключение эмоциональных концепций LLM с помощью отрицательного градиента

+36 ещё

Evaluation & benchmarks 822 →

arxiv только что

RAS: Измерение безопасности LLM через согласование с отказом

arxiv только что

Хватает ли только энкодеров? Систематическое сравнение судей безопасности на основе энкодеров и декодеров для adversarial-оценки больших языковых моделей

arxiv 1 ч назад

Бенчмарк Argus оценивает стабильность количественной оценки неопределённости для моделей «зрение-язык» и наборов данных GUI Grounding

+819 ещё

Training methods 223 →

arxiv только что

OPERA: Согласование открытого рассуждения посредством объективного обучения с подкреплением на основе перплексии

media 1 ч назад

Niodoo: локальный рантайм для управления скрытым состоянием замороженных LLM

media 1 ч назад

Вопрос о формате промпта для обучения Unsloth/Phi-3.5-mini-instruct

+220 ещё

Reasoning models 685 →

arxiv только что

OPERA: Согласование открытого рассуждения посредством объективного обучения с подкреплением на основе перплексии

arxiv 11 ч назад

LLMs используют логику разности для изучения причинной структуры

arxiv 14 ч назад

Gazer: обнаружение ошибок семантики без обучения для автокорректирующих визуальных моделей

+682 ещё

API & product launches 54 →

media 1 ч назад

Пользователи сообщают о недоступности инструментов и MCP-сервера для Step 3.7 Flash в HuggingChat

blog 3 ч назад

Саймон Уиллисон преобразует данные о совместимости браузеров MDN в базу данных SQLite

media 4 ч назад

Пользователи сообщают о сбое доступа к инструменту Flash модели Step 3.7 в HuggingChat

+51 ещё

AI agents 381 →

media 1 ч назад

Niodoo: локальный рантайм для управления скрытым состоянием замороженных LLM

arxiv 1 ч назад

Бенчмарк Argus оценивает стабильность количественной оценки неопределённости для моделей «зрение-язык» и наборов данных GUI Grounding

arxiv 1 ч назад

ToolBench-X: Оценка агентов, использующих инструменты, в ненадежных средах

+378 ещё

Open weights 207 →

media 2 ч назад

Выпущены несексуризированные сбалансированные Gemma4-26B-A4B и 31B-QAT со ускорением за счёт MTP

media 4 ч назад

GLM-5.2 на 4x DGX Spark: Восстановление недостающих шагов сборки для MTP спекулятивного декодирования

media 8 ч назад

SDXL работает локально в браузере на WebGPU, открытый исходный код

+204 ещё

Hardware & chips 34 →

media 4 ч назад

Вопрос о кластеризации Nvidia DGX Spark и AMD Ryzen AI Max 395 для вывода с использованием единой памяти

media 4 ч назад

Восстановленный док-станция MINISFORUM DEG1 Oculink для eGPU доступна за $59

media 1 д назад

7 китайских компаний поставляют чипы класса H100/H200, большинство из которых были запущены в течение последних 6 месяцев

+31 ещё

Image generation 51 →

media 8 ч назад

SDXL работает локально в браузере на WebGPU, открытый исходный код

arxiv 18 ч назад

Атомарные языковые модели понимают и генерируют материалы

media 20 ч назад

Unlimited-OCR теперь доступен на ModelScope

+48 ещё

Code generation 270 →

media 9 ч назад

Я разработал Windows Copilot в виде бесплатной OpenAI-совместимой API

lab 9 ч назад

Геми 3.5 Флэш добавляет функцию использования компьютера

media 10 ч назад

Кто-нибудь еще замечал, что выводы vLLM хуже, чем в llama.cpp?

+267 ещё

Voice & audio 37 →

lab 11 ч назад

Введение в рейтинг FFASR: оценка ASR в реальных условиях

arxiv 21 ч назад

Выпущена версия v0.1 CN-NewsTTS Bench

arxiv 1 д назад

Постер: Исследование обнаружения мошеннических звонков на основе аудио в турецком

+34 ещё

Multimodal 152 →

arxiv 11 ч назад

Эффективные мультимодальные модели для оценки риска пневмонии

arxiv 11 ч назад

MMGist: Комплексная мультимодальная оценка для 2027 года

arxiv 13 ч назад

Глубокое обучение для распознавания жестов и перевода на индийские языки

+149 ещё

Robotics 16 →

arxiv 17 ч назад

Интерпретация временных деревьев поведения с помощью Reward-Petri-Net

arxiv 2 д назад

Классификация концептуальной синхронизации в диалогах человека-робота

lab 3 д назад

NVIDIA представляет Halos для робототехники: полносистемный функциональный системный подход

+13 ещё

Policy & regulation 20 →

media 20 ч назад

Законопроект о принудительном внедрении отслеживания местоположения чипов ИИ получает поддержку от отрасли

arxiv 1 д назад

Машинное раскрытие информации: нормативный и принципиальный подход

lab 1 д назад

OpenAI развивает общие стандарты ИИ через Appia Foundation

+17 ещё

Training data 69 →

arxiv 23 ч назад

UD_Czech-PDTC: Большой и жанрово-разнообразный корпус в универсальных зависимостях

arxiv 2 д назад

Koshur Pixel: Первый масштабный синтетический набор данных для распознавания текста на кашмирском языке

lab 3 д назад

Включить реальное время ИИ для высокоскоростного сбора данных с помощью DAQIRI

+66 ещё

Benchmark results 26 →

media 2 д назад

GLM-5.2 — новый лучший открытый модель

media 5 д назад

GLM-5.2 — это новый ведущий открытый модельный вес на Индексе искусственного аналитического интеллекта

media 5 д назад

Выпущена новая оценка агентов

+23 ещё

Video generation 1 →

media 6 д назад

Локальный агент LLM теперь генерирует изображения и видео в автономном режиме