Все статьи — korshunov.ai

Все статьи Страница 1 / 121

о заявлении Дарио

Этот пост на Reddit из сообщества r/LocalLLaMA обсуждает заявление, сделанное Дарио Амодеи. Контент ограничен заголовком и метаданными, без подробного текста или анализа в источнике.

arxiv arXiv cs.AI · 6 ч назад

Могут ли агрегированные инварианты ускорить непрерывное сопоставление подграфов? Пределы, законы и динамический спектральный индекс

В данном исследовании оценивается, может ли спектральная фильтрация ускорить непрерывное сопоставление подграфов (CSM) на динамических графах; установлено, что хотя ленивое обслуживание неэффективно, селективное точное обслуживание обеспечивает значительный прирост производительности.

arxiv arXiv cs.AI · 6 ч назад

Обнаружение ИИ-агентов для программирования в открытых исходных кодах: проверенная многометодная перепись 180 миллионов репозиториев

Многоуровневая система обнаружения, анализирующая 180 миллионов Git-репозиториев, показывает, что методы с одним сигналом значительно недооценивают распространенность генеративных ИИ-агентов для программирования, упуская до 97% активности. Исследование выявляет более 320 000 коммитов в месяц от агентов, таких как Claude Code, который доминирует в скрытом внедрении через конфигурационные файлы, а не через бот-аккаунты.

arxiv arXiv cs.AI · 6 ч назад

Поведение трансформаций изображений в латентном пространстве

В данной работе исследуется, как классические трансформации изображений влияют на эмбеддинги в латентном пространстве с использованием энкодеров от компаний Lunit Inc., Bioptimus и исследовательской группы Meta.

arxiv arXiv cs.AI · 6 ч назад

MedPCFM: Улучшение завершения медицинских точечных облаков путём интеграции Point Transformer и Flow Matching

В статье представлен PCFM — подход на основе flow matching для завершения медицинских точечных облаков, интегрирующий Point Transformer v3 (PTv3) для решения проблемы недостаточно изученного генеративного моделирования в данной области. Метод оценивается на наборах данных SkullFix, SkullBreak и Mandibular Defect по сравнению с сильными детерминированными и диффузионными базовыми моделями.

arxiv arXiv cs.AI · 6 ч назад

ReM-MoA: Память рассуждений поддерживает масштабирование Mixture-of-Agents

Авторы предлагают ReM-MoA, фреймворк Mixture-of-Agents с дополненной памятью, предназначенный для поддержания прироста производительности по мере увеличения глубины модели, решая проблемы деградации и насыщения, обнаруженные в существующих вариантах. Система использует Ранжированную Память Рассуждений (Ranked Reasoning Memory) и схему маршрутизации Curated Diversified Memory Routing для сохранения разнообразия исследования при распространении высококачественных трасс рассуждений через слои.

arxiv arXiv cs.AI · 6 ч назад

NoContactNoWorries: Оценка контакта через зрение и проприоцепцию для ловкой манипуляции в руке

Исследователи предлагают NoContactNoWorries, основанную на трансформерах систему, которая выводит бинарные состояния контакта во время манипуляции в руке путем слияния RGB-D зрения с проприоцепцией робота. Этот подход служит масштабируемым псевдо-тактильным сигналом, избегая затрат и хрупкости, связанных с выделенными аппаратными тактильными датчиками.

arxiv arXiv cs.AI · 6 ч назад

Байесовский контроль для агентов по написанию кода

В данной статье представлен байесовский контроллер для оркестрации современных агентов по написанию кода, решающий ограничения систем с фиксированными правилами, которые игнорируют неопределённость при использовании инструментов.

media r/LocalLLaMA · 6 ч назад

Что случилось с Petals (децентрализованными выводами) от BigScience?

Предоставленный исходный контент представляет собой ссылку на публикацию в Reddit и не содержит текста статьи или деталей обсуждения.

media r/LocalLLaMA · 6 ч назад

Пользователь Reddit предлагает OpenAI выпустить GPT-OSS-2 для противодействия IPO Anthropic

Пользователь Reddit предлагает OpenAI запустить мощную модель с открытым исходным кодом, названную GPT-OSS-2, совпавшую по времени с предстоящим IPO Anthropic.

media r/LocalLLaMA · 6 ч назад

Qwen3-tts.cpp и графический интерфейс Compose Desktop для локального синтеза речи

Разработчик выпустил оптимизированную реализацию на C++ для Qwen3-TTS, обеспечивающую скорость около 5x в реальном времени на RTX 5080, а также кроссплатформенный десктопный GUI, созданный с помощью Kotlin Compose Multiplatform. Проект предоставляет инференс на базе GGML, поддерживающий выполнение как на CPU, так и на CUDA в Windows и Linux.

arxiv arXiv cs.AI · 7 ч назад

Африканский языковой налог: количественная оценка стоимости, задержки и контекстного штрафа при токенизации африканских языков в передовых LLM

Исследование количественно оценивает структурный штраф за токенизацию, с которым сталкиваются африканские языки в коммерческих больших языковых моделях, показывая, что пользователи платят больше и испытывают большую задержку из-за неэффективного назначения подслов. Для 20 африканских языков и 11 передовых токенизаторов каждый протестированный язык имеет премию по сравнению с английским, медианные затраты достигают 1,88 раза от английского и до 8,92 раза для скрипта Нко.

arxiv arXiv cs.AI · 7 ч назад

CompressKV: Сжатие KV-кэша, направляемое семантическим поиском, для ресурсоэффективного вывода длинноконтекстных LLM

Авторы предлагают CompressKV — фреймворк, который сжимает ключ-значения (key-value) кэши в больших языковых моделях на основе GQA, выявляя семантические поисковые головы для сохранения критически важных токенов. Этот подход решает проблему снижения производительности, вызванного существующими эвристическими методами вытеснения, которые игнорируют различные функции голов внимания.

blog Simon Willison · 7 ч назад

Подсчёт количества вкладок в Safari

В этой статье описан лаконичный метод подсчёта открытых вкладок браузера в Safari с помощью AppleScript. Предоставленная команда выполняется через терминал для получения общего количества вкладок во всех окнах.

media r/LocalLLaMA · 7 ч назад

PR DeepSeek V4 объединён с llama.cpp

В репозиторий llama.cpp объединён pull request, поддерживающий DeepSeek V4, что позволяет пользователям запускать модель локально.

media r/LocalLLaMA · 7 ч назад

Предлагаемые компоненты для полного автономного набора локального ИИ

Пользователь Reddit описывает исчерпывающий список программного обеспечения и моделей для офлайн-хранения, чтобы сохранить доступ к возможностям локального ИИ в случае широких интернет-ограничений или запретов. Предлагаемый набор сосредоточен на сохранении необходимых инструментов, операционных систем и весов моделей для обеспечения работоспособности без внешних зависимостей.

media Hugging Face Forums · 7 ч назад

Проект UCTF: Открытая исследовательская программа по машинно-нативным представлениям для обучения ИИ

Проект UCTF был реорганизован из единого предложения в открытую, основанную на проверке гипотез исследовательскую программу для изучения того, могут ли машинно-нативные промежуточные представления снизить перекрестное языковое семантическое избыточное содержание при обучении многоязычных ИИ.

media Hugging Face Forums · 7 ч назад

Ошибка при генерации сертификата курса по глубокому обучению с подкреплением

Пользователь сообщает о возникновении ошибки при попытке сгенерировать сертификат об окончании курса Deep RL на Hugging Face. Проблема сохраняется, несмотря на ввод требуемых данных имени пользователя и полного имени, при этом в интернете отсутствует какая-либо существующая инструкция.

lab Hugging Face Blog · 7 ч назад

DiScoFormer: один трансформер для плотности и оценки, по распределениям

В статье представлен DiScoFormer, унифицированная модель-трансформер, способная выполнять задачи оценки плотности и генерации на основе оценок в различных распределениях данных.

lab Google — The Keyword (AI) · 7 ч назад

Спросите эксперта по ИИ: что именно такое полный стек?

Эксперт Google объясняет концепцию применения полного стека в искусственном интеллекте. В статье подчеркивается, что этот комплексный подход на протяжении длительного времени служил основой для работ Google в области ИИ.