Research paper
arxiv arXiv cs.LG · 7 д назад

Локальные сертификаты риска для обновления моделей

В статье представлены локальные сертификаты, которые обеспечивают двусторонние доверительные интервалы для увеличения риска популяции вокруг текущей модели. Верхняя граница этого интервала определяет правило обновления с контролем риска: обновление принимается только тогда, когда верхняя граница сертифицирована не положительна, в противном случае текущая модель сохраняется.

arxiv arXiv cs.CL · 7 д назад

Morpheus: нейронный токенизатор и векторизатор для турецкого языка

Morpheus — это морфологически осознанный нейронный токенизатор и векторизатор для турецкого языка, который сохраняет исходный текст за счёт безпотерьного кодирования и декодирования. Он достигает наименьшего количества бит на символ (1,425), улучшает морфологическую синхронизацию (MorphScore macro-F1 0,61) и использует на 19% меньше видеопамяти, чем токенизаторы на основе подслов с словарём из 64 тысяч слов. Векторы Morpheus, закреплённые в памяти, превосходят BGE-M3 и BERTurk по лексическому поиску, с показателем MAP по корневым семействам 0,85 и ROC-AUC 1,00.

arxiv arXiv cs.CL · 7 д назад

LegalWorld: Циклическая среда для юридических агентов

LegalWorld моделирует китайские гражданские судебные разбирательства как причинно связанный цепочку из пяти стадий, основываясь на 75 309 решениях. В нем включены повторно используемые инфраструктуры для поддержания согласованности на всех стадиях и позволяет LongJud-Bench оценивать производительность агентов на всех этапах, выявляя значительные пробелы в способностях моделей в различных юридических задачах.

arxiv arXiv cs.CL · 8 д назад

Graph-ESBMC-PLC: Формальная проверка графических программ PLCopen LD

Graph-ESBMC-PLC обеспечивает формальную проверку графических программ IEC 61131-3 на языке схем (Ladder Diagram) за счет введения разрешителя на основе поиска в глубину, который преобразует графические соединения LD в допустимую промежуточную форму представления GOTO. Проверка на трех реальных программах показывает полное генерирование IR и успешную проверку свойств безопасности при k=2 за 70 мс, без регрессии на текстовых бенчмарках.

arxiv arXiv cs.CL · 8 д назад

Средние и поздние части научных статей раскрывают ключевую методологическую информацию

Этот исследовательский материал показывает, что методологическая информация в научных статьях распределяется неравномерно, и средние-поздние и конечные части содержат большую дискриминирующую силу. Сочетание этих частей с библиографическими метаданными повышает точность автоматической классификации научных методов в библиотечной и информационной науке.

arxiv arXiv cs.AI · 8 д назад

Масштабирование системы аварийного торможения с использованием огромных объемов непримечаемых данных через мета-обратную связь в semi-supervised learning

Мета-обратная связь в полуосуществленном обучении позволяет масштабировать систему аварийного торможения с использованием огромных объемов непримечаемых данных из автопарков. Устойчивый подход снижает ошибки псевдометок за счет разъединения, учитывающего шум, и псевдометки, основанные на кинематике, что повышает безопасность за счет соотношения 100:1 между положительными и ложными активациями и на 35% больше километров без аварий по сравнению с системами на основе правил.

arxiv arXiv cs.AI · 8 д назад

Нейронные сети с учетом сдвига домена для оценки несбалансированных масс

Предлагается нейронная сеть с учетом сдвига домена для оценки несбалансированных масс в вращающихся системах при изменяющихся условиях. Модель использует максимальное среднее отклонение для синхронизации представлений признаков между различными рабочими доменами, повышая точность предсказания при том, что поведение системы отличается от условий обучения. Результаты показывают ее эффективность в приложениях мониторинга состояния конструкций.

arxiv arXiv cs.AI · 8 д назад

TransitNet достигает точности 95,2% при поиске транзитов в условиях низкого уровня шума

TransitNet, компактная архитектура глубокого обучения с усилением внимания, достигает точности 95,2% при поиске транзитов в условиях низкого уровня шума, превосходя TLS и BLS по значениям ROC-AUC и PR-AP. Он восстанавливает 93,0% введенных транзитов размером Земли и подземной Земли, 97,4% введенных транзитов полностью охвачены оцененными окнами транзита, и успешно восстанавливает все 34 подтвержденных планет Кеплера с средней ошибкой в середине 1,24 часа.

arxiv arXiv cs.AI · 8 д назад

Изменчивость в программном обеспечении, созданном с помощью ИИ: Новый подход к разработке линейки продуктов

Экспериментальный анализ 10 проектов на языках C/C++, кодированных по принципу vibe, показывает практически нулевую изменчивость в артефактах, при этом все решения принимаются на этапе генерации. В статье предлагается подход Variability by Regeneration (VbR), в котором LLM выступает в роли двигателя дифференциации, генерируя настраиваемые бинарные файлы из декларативных спецификаций, при этом диспетчер вариантов направляет запросы пользователя на соответствующий бинарный файл. Vb-Р переносит изменчивость в спецификации, а не в код, предлагая новый парадигм для инженерии систем с переменными параметрами.

arxiv arXiv cs.AI · 8 д назад

XAI раскрывает ключевые факторы в европейских электрических рынках

Исследование использует методы SHAP и SSHAP для анализа факторов, влияющих на цены на электроэнергию, в 39 европейских зонах торгов. Оно выявляет, что солнечная энергия оказывает превосходное влияние на цены, газ остается доминирующим фактором, а взаимосвязи подчеркивают региональную взаимозависимость. Исследование также строит синтетический единый рынок Европы для анализа полностью интегрированной ситуации.

arxiv arXiv cs.AI · 8 д назад

Техническая классификация протоколов коммуникации агентов на основе ЛЛМ

Новая классификация классифицирует протоколы коммуникации агентов на основе ЛЛМ по пяти измерениям: сопряжённый субъект, нагрузка, состояние взаимодействия, механизм обнаружения и гибкость схемы. Анализ показывает, что гибридные нагрузки, сохранение состояния сессии и переговоры о схеме во время выполнения являются распространенными, в то время как децентрализованное обнаружение остаётся редким. Исследование прогнозирует краткосрочную тенденцию к унификации протоколов агент-к-агенту и агент-к-контексту, и долгосрочное развитие в сторону распределённой, многоуровневой стека протоколов.

arxiv arXiv cs.AI · 8 д назад

OrthoReg: ортогональная регуляризация для гибридных символических-нейронных динамических систем

OrthoReg вводит ортогональную регуляризацию для предотвращения того, что нейронные компоненты переподучивают символические структуры в гибридных динамических системах. Средством прямого штрафа за пересечение между символическими и нейронными частями, оно обеспечивает дополнительную декомпозицию, при которой символические модели отвечают за выражимую физику, а нейронные компоненты — за оставшиеся динамические процессы. На тестовых наборах с частичным несовпадением библиотек, OrthoReg улучшает восстановление символических структур и производительность вне распределения.

media Don't Worry About the Vase · 8 д назад

Без проникновения: сценарий "Исправьте этот код" в Fable был фальшивым

Статья подтверждает, что не произошло реального проникновения в ИИ Fable от Anthropic. Вместо этого проводился тест с фальшивым кодом, содержащим встроенные уязвимости, при котором Fable отказался проверять код и отвечал только на запрос исправить этот код после ручных действий. Кейти Муссурис из Luta Security утверждает, что такой сценарий не должен вызывать контроль экспорта, называя его намеренным, искусственно созданным тестом, который оспаривает утверждения о нарушении безопасности.

media Interconnects · 8 д назад

Блог о состоянии соединительных технологий, середина 2026 года

Автор формулирует три основные цели: уточнение эволюции передовых моделей ИИ, создание открытой экосистемы ИИ и формирование институтов, поддерживающих эти миссии. Соединительные технологии выступают независимым и прямым голосом в области мышления передовых моделей ИИ, и имеют техническую аудиторию более чем из 70 000 подписчиков. Блог сохраняет платные комментарии для предотвращения шума, генерируемого искусственным интеллектом, и автор планирует достичь 1000 платных подписчиков к лету, подчеркивая финансовую устойчивость и независимость в условиях роста стоимости услуг ИИ.

arxiv arXiv cs.LG · 8 д назад

INI-VPINN: нейронная сеть с физическими условиями, с упрощённым обработкой границ

INI-VPINN — это вариационная физически обусловленная нейронная сеть, которая неявно обеспечивает условия Неймана и условия на границах с помощью весовых функций с компактной поддержкой и интегрированием по частям. Она обеспечивает более высокую точность и быстрый сходимость по сравнению с существующими методами PINN при решении задач с несколькими материалами и геометрическими особенностями, а также с смешанными условиями на границах, и доступна на GitHub.

arxiv arXiv cs.LG · 8 д назад

ConTex: Глобальное генерирование контрапротивных сценариев для прогнозирования временных рядов

ConTex переформулирует генерацию контрапротивных сценариев для прогнозирования временных рядов как задачу глобально согласованного вмешательства. Оно достигает уровня валидности, соответствующего самым современным достижениям, с редкими, интерпретируемыми вмешательствами, снижает вычислительные затраты в 12-36 раз и позволяет проводить реальное включение за примерно 0,007 секунд.

arxiv arXiv cs.LG · 8 д назад

Глубокое обучение с подкреплением для минимального нуля-вынуждающего множества

В этой статье предложена SD-ZFS, фреймворк глубокого обучения с подкреплением, адаптированный из S2V-DQN, для решения задачи минимального нуля-вынуждающего множества, которая является NP-сложной, на неориентированных графах. Фреймворк демонстрирует сильную производительность по сравнению с оптимальными решениями и жадными эвристиками, показывая эффективную обобщаемость, масштабируемость и переносимость на разнообразные структуры графов.

arxiv arXiv cs.LG · 8 д назад

LiL-Q: Конвексный метод для нелинейных дифференциальных уравнений в частных производных с PINNs

Новый конвексный метод квазилинейнойизации, LiL-Q, решает нелинейные дифференциальные уравнения в частных производных, приводя их к линейным подзадачам с помощью физически обусловленных нейронных сетей. LiL-Q сходится за несколько итераций на семи тестовых задачах, достигая машинной точности при наличии точного решения в пространстве проб, и требует до двух порядков величины меньше параметров, чем стандартные решатели PINNs.

arxiv arXiv cs.LG · 8 д назад

Побеждает ли метод сжатия датасетов перед коорсетами?

Большие эксперименты показывают, что современные методы сжатия датасетов сравнимы или хуже, чем выбор коорсетов на ImageNet и ImageNette. Коорсеты стабильно обеспечивают лучшее покрытие данных и являются более вычислительно эффективными, что подчеркивает их практическое превосходство над сжатыми датасетами.

arxiv arXiv cs.LG · 8 д назад

Знаковый ранг, индекс и повторяемость списка: связи и разрывы

Статья доказывает, что индекс \mathbb{Z}_2- является верхней границей линейной функции от числа повторяемости списка. Она доказывает сильное разделение между знаковым рангом и индексом \mathbb{Z}_2 и показывает, что повторяемость списка ограничена высотой и минимальным числом звезд, с результатом о составлении для произведения классов концепций.