Open weights — korshunov.ai — новости ML

Тема · Open weights

LOGOS — это единая генеративная языковая модель, которая представляет научные объекты и их взаимодействия в виде последовательностей токенов в общей грамматике. Модель достигает стабильной или превосходной производительности на различных задачах естественных наук, демонстрируя возможность использования одной модели для работы в нескольких областях. Производительность модели растёт с увеличением количества параметров, и её конструкция указывает на то, что искусственный интеллект для науки должен тесно интегрироваться с большими языковыми моделями через общие архитектуры и обучение.

media r/LocalLLaMA · 9 д назад

Пожертвуйте свои сессии программирования в открытую базу данных под лицензией CC-BY-4.0

Проект под названием Trace Commons приглашает пользователей пожертвовать свои отслеживаемые сессии программирования в открытую базу данных, лицензированную под CC-BY-4.0. Инициатива направлена на предоставление обучающих данных для открытых моделей и открытого программного обеспечения, противодействуя возможным монополиям в области данных, связанным с Anthropic и OpenAI.

media r/LocalLLaMA · 9 д назад

Nex-N2 Pro — это настоящее качество

Пользователь обнаружил, что N2 Pro, при использовании шаблона чата Rio, работает стабильно на их Mac с объёмом памяти 128 ГБ. Он прошёл частный тест на коде llama.cpp на 100% без выдумок, соответствуя только GPT 5.x по стабильности.

arxiv arXiv cs.AI · 9 д назад

RAID: Семантическое графовое диффузионное моделирование для истинного холодного запуска и межязыкового прогнозирования

RAID представляет рамку, использующую метаданные-ориентированное семантическое извлечение и диффузионное моделирование на основе графа для решения задач истинного холодного запуска. Оно превосходит фундаментальные модели и базовые подходы по точности прогнозирования и покрытию интервалов, значительно снижает задержку инференса и позволяет осуществлять нулевую штуку межязыковую трансфер через общий семантический пространство.

arxiv arXiv cs.AI · 9 д назад

CircuitLasso: масштабируемый метод обучения разреженных схем для интерпретируемости больших языковых моделей

CircuitLasso предлагает масштабируемый метод обучения разреженных схем в больших языковых моделях с использованием разреженной линейной регрессии. Он достигает структурной точности, сравнимой с методами, основанными на вмешательстве, при значительно меньших вычислительных затратах, одновременно обеспечивая эффективное обнаружение распространения семантических признаков и улучшая производительность на задачах обобщения в области с уменьшенными затратами.

arxiv arXiv cs.AI · 9 д назад

Каузальный фреймворк для аудита раскрытий синтетических данных

Новый эмпирический фреймворк аудита обнаруживает и классифицирует раскрытия синтетических данных как истинные или фантомные. Он отличает прямые копии пользовательских данных от случайного генерирования без доступа к модели или её обучению, используя только синтетические выходы и контрольную выборку. Метод обеспечивает более строгие границы утечки конфиденциальности, чем ранее разработанные подходы, и требует значительно меньших вычислительных ресурсов.

arxiv arXiv cs.AI · 9 д назад

Документация по исследованию ИИ улучшается в течение десятилетия

Анализ 56 800 статей на конференциях по ИИ показывает, что практики документирования улучшились с 2014 по 2024 год. Доля статей, в которых публиковались как код, так и данные, возросла с 11% до 64%, а оценка воспроизводимости увеличилась с 28% до 64%. Эти улучшения предшествуют официальным проверкам воспроизводимости, что указывает на более широкий сдвиг в сторону открытой науки.

arxiv arXiv cs.AI · 9 д назад

TuneJury: Открытый метрический инструмент для выравнивания предпочтений в генерации музыки

TuneJury — это открытая модель парного вознаграждения на уровне экземпляров, которая предсказывает оценки предпочтений музыки на основе текстовых запросов и аудио-фрагментов. Модель обучена на разнообразных данных человеческих предпочтений и демонстрирует сильную обобщаемость, при этом калибровка анкоров позволяет эффективно проводить пост-обучение для систем генерации музыки.

arxiv arXiv cs.LG · 9 д назад

Оптимизация Hyperball для ускорения обучения языковых моделей

Hyperball — это простой обертка оптимизатора, которая устанавливает фиксированные нормы Фробениуса для матриц весов и их обновлений. Она повышает скорость обучения и передачу скорости обучения в больших моделях, обеспечивая ускорение на 20--30% по количеству токенов по сравнению с базовыми вариантами с весовым уменьшением на моделях до 1,2 миллиарда параметров.

arxiv arXiv cs.LG · 9 д назад

Каузальный подход к аудиту раскрытий синтетических данных

Модель-независимый подход к аудиту обнаруживает и различает настоящие и фантомные раскрытия в синтетических данных. Он использует только синтетические выводы и контрольную выборку, чтобы проводить статистические проверки, обеспечивая более строгие границы утечки конфиденциальности, чем ранее известные методы, без необходимости доступа к модели или дополнительного обучения.

arxiv arXiv cs.LG · 9 д назад

TuneJury: Открытый метрический инструмент для выравнивания предпочтений в генерации музыки

TuneJury — это открытая модель парного вознаграждения на уровне экземпляров, которая предсказывает оценки предпочтений музыки на основе текстовых запросов и аудио-фрагментов. Модель обучена на разнообразных данных человеческих предпочтений и демонстрирует сильную обобщаемость, при этом использование калибровки опорных точек позволяет эффективно проводить пост-обучение для систем генерации музыки.

media r/LocalLLaMA · 9 д назад

Выпущен Qwable-v1 как дистиллят Claude Fable-5

Qwable-v1, открытая модель, дистиллированная из Fable-5 от Anthropic, теперь доступна в общественном доступе на Hugging Face. Она содержит 4659 прямых текстовых следов агентного кодирования из публичного корпуса Fable-5 и генерирует корректно сформированные вызовы <tool_use> в формате XML для инструментов, характерных для Claude, отражая исходную поверхность инструментов в своих весах.

media r/LocalLLaMA · 9 д назад

Слияние GPU для обучения сообщественной модели

Пользователь Reddit спрашивает, успешно ли кто-то объединяет GPU для обучения сообщественной модели, указывая на трудности, такие как задержка и заражение весами. Пост задает вопрос о том, достигли ли текущие проекты распределённого добровольного вычисления успешного обучения сообщественной модели.

media r/LocalLLaMA · 9 д назад

AeroLLM: быстрая, открытая ИИ-приложение для процессоров Apple Silicon

AeroLLM — это быстрая, оптимизированная и открытая чат-приложение, разработанное для устройств на процессорах Apple Silicon с использованием бэкенда MLX. Оно поддерживает локальные задачи по ИИ, такие как текст-в-голос, голос-в-текст и большие языковые модели, с загрузкой моделей напрямую с Hugging Face в зависимости от доступной ОЗУ. Приложение прошло сертификацию из-за отсутствия членства в Apple Developer, однако пользователи могут следовать указанным шагам, чтобы запустить его как подписанное приложение macOS.

media r/LocalLLaMA · 9 д назад

Еще ли квантованные модели генерации изображений находятся в стадии разработки?

Пользователи отмечают непостоянные результаты при использовании квантованных моделей для генерации изображений, при этом SD 1.5 работает хорошо, а SDXL — нет. Несмотря на успешное преобразование и квантование с помощью инструментов, таких как convert.py и llama-quantize, некоторые пользователи получают плохие результаты, в то время как другие — нет, что вызывает вопросы относительно текущего состояния и надежности технологии квантованной генерации изображений.

media r/LocalLLaMA · 9 д назад

Nex2 mini Phase Twin 16 ГБ, модель 30B выпущена

Модель Nex2 mini Phase Twin с 30 миллиардами параметров и объемом памяти 16 ГБ теперь доступна для пользователей Intel, в частности для линейки A770. Она работает со скоростью 89 токенов в секунду на одной карте A770 и оптимизирована для использования соответствующего ядра в зависимости от оборудования, обеспечивая повышенную производительность при использовании двух карт.

arxiv arXiv cs.CL · 9 д назад

Символьная неформализация в проекте Informath

Проект Informath демонстрирует символическую неформализацию для преобразования формальных математических доказательств в естественный, гладкий и точный язык. Он использует Dedukti как центральный узел, соединяющий системы доказательств, такие как Agda, Lean и Rocq, с Grammatical Framework, обеспечивающим правильность языковой структуры на нескольких языках.

arxiv arXiv cs.AI · 9 д назад

Символическая неформализация в проекте Informath

Проект Informath демонстрирует символическую неформализацию для преобразования формальной математики в естественный, гладкий и точный язык. В проекте используется Dedukti как центральная система доказательств и Grammatical Framework для обеспечения лингвистической корректности на нескольких языках, что позволяет получать человеко-читаемые выводы из доказательств, сгенерированных ИИ.

arxiv arXiv cs.AI · 9 д назад

Прогресс, обусловленный ИИ, в стабильных меню общественных благ

Эксперименты по теме "Стабильные меню общественных благ" на конференции EC 2025 показывают, что промпты, основанные на человеческой интуиции, улучшают производительность ЛЛМ и мульти-переводные взаимодействия усиливают амбициозные шаги. Однако при сравнении с первым годом аспиранта, использующим непубликованный рукописный материал, ЛЛМ оказывается слегка менее эффективным.

arxiv arXiv cs.LG · 9 д назад

Dynestyx: Вероятностное программирование для динамических систем

Dynestyx — это библиотека вероятностного программирования, которая обеспечивает первоклассную поддержку для моделей пространства состояний. Она позволяет пользователям задавать произвольные предпосылки для дискретных или непрерывных динамических систем, проводить инференс на смешанных данных и получать оценки состояний и параметров с принципиальной оценкой неопределённости.

LOGOS: Общее генеративное моделирование для естественных наук

Пожертвуйте свои сессии программирования в открытую базу данных под лицензией CC-BY-4.0

Nex-N2 Pro — это настоящее качество

RAID: Семантическое графовое диффузионное моделирование для истинного холодного запуска и межязыкового прогнозирования

CircuitLasso: масштабируемый метод обучения разреженных схем для интерпретируемости больших языковых моделей

Каузальный фреймворк для аудита раскрытий синтетических данных

Документация по исследованию ИИ улучшается в течение десятилетия

TuneJury: Открытый метрический инструмент для выравнивания предпочтений в генерации музыки

Оптимизация Hyperball для ускорения обучения языковых моделей

Каузальный подход к аудиту раскрытий синтетических данных

TuneJury: Открытый метрический инструмент для выравнивания предпочтений в генерации музыки

Выпущен Qwable-v1 как дистиллят Claude Fable-5

Слияние GPU для обучения сообщественной модели

AeroLLM: быстрая, открытая ИИ-приложение для процессоров Apple Silicon

Еще ли квантованные модели генерации изображений находятся в стадии разработки?

Nex2 mini Phase Twin 16 ГБ, модель 30B выпущена

Символьная неформализация в проекте Informath

Символическая неформализация в проекте Informath

Прогресс, обусловленный ИИ, в стабильных меню общественных благ

Dynestyx: Вероятностное программирование для динамических систем