Все статьи
github llama.cpp · 7 ч назад

Релиз llama.cpp b9803 с исправлением профилирования OpenCL

Проект llama.cpp выпустил версию b9803, которая включает исправление для OpenCL, обеспечивающее сброс пакетов профилирования при завершении работы для незавершённых пакетов. Это обновление предоставляет бинарные файлы для macOS, Linux, Windows, Android и openEuler для различных аппаратных бэкендов.

github llama.cpp · 8 ч назад

Выпуск llama.cpp b9802 предоставляет бинарные файлы для macOS, Linux, Windows и Android

Проект llama.cpp опубликовал выпуск b9802, предлагающий предварительно собранные бинарные файлы для нескольких операционных систем и аппаратных архитектур. Это обновление включает поддержку процессоров (CPU), графических процессоров (GPU) и специализированных ускорителей ИИ на таких платформах, как macOS, Linux, Windows, Android и openEuler.

lab Claude Code Releases · 11 ч назад

Примечания к выпуску Claude Code v2.1.193

Версия Claude Code 2.1.193 вносит ряд улучшений в классификацию авто-режима, журналирование телеметрии и управление фоновыми агентами. Это обновление также включает исправления проблем с состоянием пользовательского интерфейса, обработкой аутентификации в серверах MCP и различных ошибок фоновых процессов.

lab Cohere Blog · 12 ч назад

Автоматизация поддержки форков с помощью AI-агентов

В этой статье описывается метод автоматизации поддержки форков программного обеспечения с использованием AI-агентов для написания кода, применённый к форку Cohere проекта vLLM. Подход сокращает время, необходимое для интеграции обновлений из основного репозитория (upstream), с недель до дней за счёт замены ручного вмешательства автоматизированным циклом обратной связи.

lab Microsoft Research Blog · 13 ч назад

Понимание работы мозга с помощью объяснений и экспериментов на базе ИИ

Исследователи разработали Generative Causal Testing (GCT) — фреймворк, который переводит неинтерпретируемые модели предсказания активности мозга на основе LLM в краткие, проверяемые вербальные гипотезы о функциях коры. Этот метод сжимает параметры модели в короткие фразы, описывающие, на какие стимулы реагируют определенные области мозга, например «приготовление пищи», а затем проверяет эти объяснения с помощью целевых фМРТ-экспериментов.

arxiv arXiv cs.LG · 13 ч назад

CoorDex: Координация телесных и кистевых априори для непрерывной ловкой манипуляции человекоподобного робота

Авторы представляют CoorDex, конвейер обучения, который обеспечивает ловкую локомоно-манипуляцию с высокой степенью свободы на движущихся человекоподобных роботах путем преобразования управления телом и кистью в скоординированное латентное остаточное управление. Этот подход позволяет человекоподобному роботу Unitree G1 выполнять сложные задачи, такие как захват бутылки без остановки и открытие дверцы холодильника, находясь в движении.

arxiv arXiv cs.LG · 13 ч назад

AutoDex: Автоматизированная система реального мира для сбора данных о ловком захвате

AutoDex — это автоматизированная система, предназначенная для замыкания цикла сбора данных о ловком захвате в реальном мире путем обработки восприятия, выполнения, маркировки и сброса без вмешательства человека. Она решает проблемы масштабируемости телеоперации и отсутствия физической сертификации в симуляции, генерируя кандидаты на захват и проверяя их на реальном оборудовании.

arxiv arXiv cs.AI · 13 ч назад

Адаптивные жёстко-мягкие физически обусловленные нейронные сети для устойчивого решения УЧП с ограничениями на границе

В данном исследовании предлагается унифицированная жёстко-мягкая физически обусловленная нейронная сеть (HSPINN) с адаптивным взвешиванием потерь для решения проблем медленной сходимости и неточного выполнения граничных условий в традиционных PINN. Фреймворк обеспечивает точное выполнение граничных условий Дирихле и периодических граничных условий посредством аналитического подъёма или маскирования, тогда как невязки УЧП и начальные условия рассматриваются как мягкие ограничения, балансируемые с помощью стратегии обратного софтмакса.

arxiv arXiv cs.AI · 13 ч назад

Переосмысление молекулярных графовых бэкдоров с учётом химически осознанного допуска

В статье представлен ChemGuard, операционный протокол, формализующий упускаемый из виду этап допуска в конвейерах обучения на молекулах за счёт требования санитизируемых строк и согласованной реконструкции графа. Эта рамка показывает, что многие существующие графовые бэкдоры теряют эффективность, поскольку их яды химически некорректны или несогласованы с представлением.

arxiv arXiv cs.AI · 14 ч назад

Измерение и смягчение эффекта пере-выравнивания для больших языковых моделей в многоязычных уголовных судах

В данной статье рассматривается проблема пере-выравнивания больших языковых моделей, используемых в контексте уголовного права Швейцарского федерального верховного суда, где защитные механизмы модели часто вызывают отказы при обработке конфиденциальных деталей дел. Авторы представляют TF-RefusalBench — многоязычный бенчмарк, созданный на основе публичных судебных решений, для измерения этого явления на французском, немецком, итальянском и английском языках.

arxiv arXiv cs.AI · 14 ч назад

Трансформеры на основе энергии как предикторы сложности чтения

В данном исследовании представлены трансформеры на основе энергии в качестве новой меры для прогнозирования сложности чтения человеком, устанавливающей формальную связь между моделями трансформеров и литературой по ассоциативной памяти, такой как сети Хопфилда.

arxiv arXiv cs.AI · 14 ч назад

Распределенно-осознанный Diffusion-LLM для устойчивого прогнозирования временных рядов на сверхдлинных горизонтах

Авторы предлагают Diffusion-LLM, фреймворк, который интегрирует условную диффузионную модель в конвейер на основе LLM для решения задач прогнозирования мультимодальных временных рядов. Такое совместное проектирование позволяет обучаться будущим распределениям данных, одновременно улучшая семантическое выравнивание в общем латентном пространстве.

media r/LocalLLaMA · 14 ч назад

Быстрый медицинский RAG-API для предоставления локальным LLM доступа к фактам

Разработчик выпустил бесплатный и простой API для Retrieval-Augmented Generation (RAG), основанный на статьях медицинской Википедии, чтобы обеспечить локальным большим языковым моделям точную фактическую информацию. Сервис ориентирован на время ответа менее секунды и в настоящее время работает на одном ARM VPS, используя около 2 ГБ оперативной памяти.