Примечания к выпуску AutoGPT Platform Beta v0.6.65
Платформа AutoGPT выпустила версию 0.6.65, внесшую значительные обновления в систему Copilot, навигацию пользовательского интерфейса и надежность инфраструктуры.
Платформа AutoGPT выпустила версию 0.6.65, внесшую значительные обновления в систему Copilot, навигацию пользовательского интерфейса и надежность инфраструктуры.
Проект llama.cpp выпустил версию b9803, которая включает исправление для OpenCL, обеспечивающее сброс пакетов профилирования при завершении работы для незавершённых пакетов. Это обновление предоставляет бинарные файлы для macOS, Linux, Windows, Android и openEuler для различных аппаратных бэкендов.
Проект llama.cpp опубликовал выпуск b9802, предлагающий предварительно собранные бинарные файлы для нескольких операционных систем и аппаратных архитектур. Это обновление включает поддержку процессоров (CPU), графических процессоров (GPU) и специализированных ускорителей ИИ на таких платформах, как macOS, Linux, Windows, Android и openEuler.
В статье анонсируется выпуск версии 0.5.14.
Версия Claude Code 2.1.193 вносит ряд улучшений в классификацию авто-режима, журналирование телеметрии и управление фоновыми агентами. Это обновление также включает исправления проблем с состоянием пользовательского интерфейса, обработкой аутентификации в серверах MCP и различных ошибок фоновых процессов.
В этой статье описывается метод автоматизации поддержки форков программного обеспечения с использованием AI-агентов для написания кода, применённый к форку Cohere проекта vLLM. Подход сокращает время, необходимое для интеграции обновлений из основного репозитория (upstream), с недель до дней за счёт замены ручного вмешательства автоматизированным циклом обратной связи.
В этом релизе предпринята попытка исправить сборку Flatpak.
Исследователи разработали Generative Causal Testing (GCT) — фреймворк, который переводит неинтерпретируемые модели предсказания активности мозга на основе LLM в краткие, проверяемые вербальные гипотезы о функциях коры. Этот метод сжимает параметры модели в короткие фразы, описывающие, на какие стимулы реагируют определенные области мозга, например «приготовление пищи», а затем проверяет эти объяснения с помощью целевых фМРТ-экспериментов.
Google Finance официально завершает бета-тестирование и запускает отдельное приложение для устройств на базе Android.
Авторы представляют CoorDex, конвейер обучения, который обеспечивает ловкую локомоно-манипуляцию с высокой степенью свободы на движущихся человекоподобных роботах путем преобразования управления телом и кистью в скоординированное латентное остаточное управление. Этот подход позволяет человекоподобному роботу Unitree G1 выполнять сложные задачи, такие как захват бутылки без остановки и открытие дверцы холодильника, находясь в движении.
Hugging Face представил новую функцию, позволяющую пользователям разворачивать серверы vLLM непосредственно через платформу Hugging Face Jobs с помощью одной команды.
Этот кандидат в релизы устраняет проблему с функциональностью Prefill/Decode (P/D) совместно с Data Parallelism (DP) Supervisor в проекте vLLM.
AutoDex — это автоматизированная система, предназначенная для замыкания цикла сбора данных о ловком захвате в реальном мире путем обработки восприятия, выполнения, маркировки и сброса без вмешательства человека. Она решает проблемы масштабируемости телеоперации и отсутствия физической сертификации в симуляции, генерируя кандидаты на захват и проверяя их на реальном оборудовании.
В данном исследовании предлагается унифицированная жёстко-мягкая физически обусловленная нейронная сеть (HSPINN) с адаптивным взвешиванием потерь для решения проблем медленной сходимости и неточного выполнения граничных условий в традиционных PINN. Фреймворк обеспечивает точное выполнение граничных условий Дирихле и периодических граничных условий посредством аналитического подъёма или маскирования, тогда как невязки УЧП и начальные условия рассматриваются как мягкие ограничения, балансируемые с помощью стратегии обратного софтмакса.
В статье представлен ChemGuard, операционный протокол, формализующий упускаемый из виду этап допуска в конвейерах обучения на молекулах за счёт требования санитизируемых строк и согласованной реконструкции графа. Эта рамка показывает, что многие существующие графовые бэкдоры теряют эффективность, поскольку их яды химически некорректны или несогласованы с представлением.
В данной статье рассматривается проблема пере-выравнивания больших языковых моделей, используемых в контексте уголовного права Швейцарского федерального верховного суда, где защитные механизмы модели часто вызывают отказы при обработке конфиденциальных деталей дел. Авторы представляют TF-RefusalBench — многоязычный бенчмарк, созданный на основе публичных судебных решений, для измерения этого явления на французском, немецком, итальянском и английском языках.
В данном исследовании представлены трансформеры на основе энергии в качестве новой меры для прогнозирования сложности чтения человеком, устанавливающей формальную связь между моделями трансформеров и литературой по ассоциативной памяти, такой как сети Хопфилда.
Авторы предлагают Diffusion-LLM, фреймворк, который интегрирует условную диффузионную модель в конвейер на основе LLM для решения задач прогнозирования мультимодальных временных рядов. Такое совместное проектирование позволяет обучаться будущим распределениям данных, одновременно улучшая семантическое выравнивание в общем латентном пространстве.
Разработчик выпустил бесплатный и простой API для Retrieval-Augmented Generation (RAG), основанный на статьях медицинской Википедии, чтобы обеспечить локальным большим языковым моделям точную фактическую информацию. Сервис ориентирован на время ответа менее секунды и в настоящее время работает на одном ARM VPS, используя около 2 ГБ оперативной памяти.
Пользователь на Reddit спрашивает, раскрыла ли Nvidia сроки поддержки операционной системы, работающей на оборудовании DGX Spark. Запрос касается в частности продолжительности поддержки ОС и того, не будут ли пользователи вынуждены в ближайшем будущем, например к 2028 году, переходить на новые продукты.