Свежие
1753 →
Выпуск llama.cpp b9786 добавляет поддержку неконгруэнтных строк через OpenCL
BITEMBED: Экстремально низкоразрядная архитектура для текстовых эмбеддингов на основе LLM
Фреймворк оценивает, когда необходимы GraphRAG и агентный RAG
RAS: Измерение безопасности LLM через согласование с отказом
TRACE: Легковесное обнаружение отравления корпуса в RAG с помощью атрибуции влияния токенов
+1748 ещё
Inference efficiency
174 →
BITEMBED: Экстремально низкоразрядная архитектура для текстовых эмбеддингов на основе LLM
Выпуск llama.cpp b9785 с усиленной проверкой флагов и бинарными файлами для нескольких платформ
Выпущены несексуризированные сбалансированные Gemma4-26B-A4B и 31B-QAT со ускорением за счёт MTP
+171 ещё
Research paper
273 →
BITEMBED: Экстремально низкоразрядная архитектура для текстовых эмбеддингов на основе LLM
Экономия пространства при генерации языка в пределе
SARA: Раскрытие многоязычных знаний в смеси экспертов через семантически закрепленную маршрутизацию
+270 ещё
Safety & alignment
194 →
RAS: Измерение безопасности LLM через согласование с отказом
TRACE: Легковесное обнаружение отравления корпуса в RAG с помощью атрибуции влияния токенов
Хватает ли только энкодеров? Систематическое сравнение судей безопасности на основе энкодеров и декодеров для adversarial-оценки больших языковых моделей
+191 ещё
Retrieval & RAG
39 →
TRACE: Легковесное обнаружение отравления корпуса в RAG с помощью атрибуции влияния токенов
Как большие языковые модели формируют репутацию брендов в разных языках и рынках
Онтологическая инверсия: переключение эмоциональных концепций LLM с помощью отрицательного градиента
+36 ещё
Evaluation & benchmarks
822 →
RAS: Измерение безопасности LLM через согласование с отказом
Хватает ли только энкодеров? Систематическое сравнение судей безопасности на основе энкодеров и декодеров для adversarial-оценки больших языковых моделей
Бенчмарк Argus оценивает стабильность количественной оценки неопределённости для моделей «зрение-язык» и наборов данных GUI Grounding
+819 ещё
Training methods
223 →
OPERA: Согласование открытого рассуждения посредством объективного обучения с подкреплением на основе перплексии
Niodoo: локальный рантайм для управления скрытым состоянием замороженных LLM
Вопрос о формате промпта для обучения Unsloth/Phi-3.5-mini-instruct
+220 ещё
Reasoning models
685 →
OPERA: Согласование открытого рассуждения посредством объективного обучения с подкреплением на основе перплексии
LLMs используют логику разности для изучения причинной структуры
Gazer: обнаружение ошибок семантики без обучения для автокорректирующих визуальных моделей
+682 ещё
API & product launches
54 →
Пользователи сообщают о недоступности инструментов и MCP-сервера для Step 3.7 Flash в HuggingChat
Саймон Уиллисон преобразует данные о совместимости браузеров MDN в базу данных SQLite
Пользователи сообщают о сбое доступа к инструменту Flash модели Step 3.7 в HuggingChat
+51 ещё
AI agents
381 →
Niodoo: локальный рантайм для управления скрытым состоянием замороженных LLM
Бенчмарк Argus оценивает стабильность количественной оценки неопределённости для моделей «зрение-язык» и наборов данных GUI Grounding
ToolBench-X: Оценка агентов, использующих инструменты, в ненадежных средах
+378 ещё
Open weights
207 →
Выпущены несексуризированные сбалансированные Gemma4-26B-A4B и 31B-QAT со ускорением за счёт MTP
GLM-5.2 на 4x DGX Spark: Восстановление недостающих шагов сборки для MTP спекулятивного декодирования
SDXL работает локально в браузере на WebGPU, открытый исходный код
+204 ещё
Hardware & chips
34 →
Вопрос о кластеризации Nvidia DGX Spark и AMD Ryzen AI Max 395 для вывода с использованием единой памяти
Восстановленный док-станция MINISFORUM DEG1 Oculink для eGPU доступна за $59
7 китайских компаний поставляют чипы класса H100/H200, большинство из которых были запущены в течение последних 6 месяцев
+31 ещё
Image generation
51 →
SDXL работает локально в браузере на WebGPU, открытый исходный код
Атомарные языковые модели понимают и генерируют материалы
Unlimited-OCR теперь доступен на ModelScope
+48 ещё
Code generation
270 →
Я разработал Windows Copilot в виде бесплатной OpenAI-совместимой API
Геми 3.5 Флэш добавляет функцию использования компьютера
Кто-нибудь еще замечал, что выводы vLLM хуже, чем в llama.cpp?
+267 ещё
Voice & audio
37 →
Введение в рейтинг FFASR: оценка ASR в реальных условиях
Выпущена версия v0.1 CN-NewsTTS Bench
Постер: Исследование обнаружения мошеннических звонков на основе аудио в турецком
+34 ещё
Multimodal
152 →
Эффективные мультимодальные модели для оценки риска пневмонии
MMGist: Комплексная мультимодальная оценка для 2027 года
Глубокое обучение для распознавания жестов и перевода на индийские языки
+149 ещё
Robotics
16 →
Интерпретация временных деревьев поведения с помощью Reward-Petri-Net
Классификация концептуальной синхронизации в диалогах человека-робота
NVIDIA представляет Halos для робототехники: полносистемный функциональный системный подход
+13 ещё
Policy & regulation
20 →
Законопроект о принудительном внедрении отслеживания местоположения чипов ИИ получает поддержку от отрасли
Машинное раскрытие информации: нормативный и принципиальный подход
OpenAI развивает общие стандарты ИИ через Appia Foundation
+17 ещё
Training data
69 →
UD_Czech-PDTC: Большой и жанрово-разнообразный корпус в универсальных зависимостях
Koshur Pixel: Первый масштабный синтетический набор данных для распознавания текста на кашмирском языке
Включить реальное время ИИ для высокоскоростного сбора данных с помощью DAQIRI
+66 ещё