Все статьи — korshunov.ai

Все статьи Страница 1 / 130

OpenAI представил инструменты безопасности Daybreak

OpenAI представил Codex Security и GPT-5.5-Cyber как часть своей системы Daybreak. Эти инструменты направлены на то, чтобы помочь организациям выявлять, проверять и устранять уязвимости в масштабе.

lab OpenAI News · 9 д назад

OpenAI запустил Patch the Planet для открытого исходного кода

OpenAI запустил Patch the Planet, инициативу Daybreak, направленную на помощь поддерживателям открытого исходного кода в выявлении, проверке и устранении уязвимостей. Программа объединяет инструменты на основе искусственного интеллекта с экспертной проверкой, чтобы повысить безопасность программного обеспечения на основе открытого исходного кода.

media r/LocalLLaMA · 9 д назад

Лучшая локальная модель для преобразования текста в структурированный JSON

Пользователи ищут локальную модель, эффективно преобразующую неструктурированный текст в действительный JSON на основе заданной схемы. Среди проверенных моделей модель Qwen 3.6 35B a3b показывает сильную производительность, соответствующую качеству более крупных моделей, таких как GPT-120B, при этом более стабильна на локальных машинах, чем GPT-20B.

github llama.cpp · 9 д назад

llama.cpp release b9760: новая схема входных данных и бинарники для нескольких платформ

Версия llama.cpp b9760 вводит переработанную схему входного файла, поддерживающую исходные видео в формате base64. В релизе представлены бинарники для macOS, Linux, Android, Windows и openEuler на нескольких архитектурах и аппаратных ускорителях, включая Vulkan, CUDA, OpenVINO и SYCL.

lab NVIDIA Technical Blog · 9 д назад

CCCL Runtime: Современный C++ runtime для CUDA

NVIDIA выпустил CCCL Runtime, современный C++ runtime, который обеспечивает более безопасные и удобные абстракции для программирования CUDA. Он вводит обновленные функции C++ для упрощения и улучшения разработки CUDA C++.

media r/LocalLLaMA · 9 д назад

Moebius: 0.2B Lightweight Image Inpainting Framework

Moebius — это фреймворк для заполнения изображений с параметрами 0,2B, который достигает производительности, сравнимой с моделями на 10B параметров. Он разработан для легкой и эффективной редактирования изображений с минимальными вычислительными требованиями.

media r/LocalLLaMA · 9 д назад

Китайские хакеры создали клон Tesla V100 v4

Китайские хакеры провели обратную инженерную разработку по схеме Tesla V100, собрали её на полувысотной печатной плате и выпустили под названием Tesla V100 v4. Версия на 16 ГБ стоит 1499 юаней (220 долларов США) с гарантией на три года, а версия на 32 ГБ — 3999 юаней (590 долларов США).

media r/LocalLLaMA · 9 д назад

TMax: Простой рецепт для агентов в терминале

TMax представляет TMax-15k, набор из 14 600 сред RL, превышающий на более чем 2,5 раза самый большой открытый набор сред в терминале. Также предлагается простой рецепт RL, который обучает открытые модели от 2 миллиардов до 27 миллиардов параметров, при этом TMax-9B достигает 27,2% на Terminal Bench 2.0, а TMax-27B — 42,7%.

media r/LocalLLaMA · 9 д назад

NEX-N2-mini утверждает достижение парето-оптимальности в эффективности мышления

Модель NEX-N2-mini утверждает, что достигает уровня мышления 3,5 и 3,6 с значительно меньшим количеством токенов мышления. Проверки показывают, что она превосходит другие модели на основе MoE по эффективности, снижая количество потерянных токенов, при этом сохраняя высокое качество мышления.

media r/LocalLLaMA · 9 д назад

Gemma4-12B-QAT Uncensored Balanced Released with 60% Speed Boost via MTP

Модель Gemma4-12B-QAT Uncensored Balanced теперь доступна, с улучшением скорости на 60% за счёт спекулятивного декодирования на основе многотокенного предсказания (MTP). В ней используется квантование Q4_K_M, поддержка визуальных данных через mmproj и стабильное генерирование без циклов или смещения контекста, что делает её идеальной для задач креативного написания и эмоционального интеллекта.

media r/LocalLLaMA · 9 д назад

Одинаковая модель, одинаковый промпт, 4 разных агента дают разную качество кода

Самостоятельная модель Qwen3.6-27B с идентичным промптом и одинаковым оборудованием сгенерировала четыре различных HTML/JavaScript-симуляции солнечной системы. Структура агента значительно влияла на результат: opencode сгенерировал чистый, стабильный код с точными физическими расчетами; pi продемонстрировал устойчивость и согласованность координат; hermes предложил визуально привлекательные, но физически некорректные результаты; qwen code сгенерировал минимальный и грубый код. Результаты показывают, как проектирование агента формирует качество, корректность и стабильность кода, несмотря на одинаковую модель и промпт.

media Interconnects · 9 д назад

GLM-5.2 — шаг вперёд для открытых агентов

GLM-5.2, открытая модель ИИ, выпущенная Z.ai, установила новый уровень в программировании и общих показателях работы агентов. Она превосходит модели, такие как Claude Fable 5 и Gemini, и достигает или превосходит OpenAI's Opus 4.8 в режиме максимального мышления, становясь первым открытым моделью, которая чувствует себя естественно в программных средах как общий агент.

lab NVIDIA Technical Blog · 9 д назад

Включить реальное время ИИ для высокоскоростного сбора данных с помощью DAQIRI

Успех AlphaFold2 в 2020 году зависел от 170 000 структур белков из Базы данных белков. Система DAQIRI от Nvidia позволяет выполнять реальное время обработку ИИ для высокоскоростного сбора данных, анализируя данные при их генерации.

media r/LocalLLaMA · 9 д назад

Проверка скорости GLM-5.2 UD-IQ1_M на llama.cpp с 5090 и 3090 Ti

Проверка скорости GLM-5.2, квантованной до UD-IQ1_M, с использованием llama.cpp показывает 579 t/s при предзаполнении на 8k контексте и 324 t/s при 57k контексте. Скорость декодирования остается стабильной на уровне 10.6 t/s более чем на 580 токенов, снижаясь до 9.37 t/s при 60k контексте.

media r/LocalLLaMA · 9 д назад

Какой каркас вы используете?

Пользователь просит рекомендации по корпусам с несколькими видеокартами, конкретно упоминая модель телескопического корпуса с двумя камерами для 6 видеокарт, доступную на Алиэкспресс. Он ищет обратную связь по этому варианту и его пригодности для установки высокопроизводительных видеокарт.

lab NVIDIA Technical Blog · 9 д назад

NVIDIA представляет Halos для робототехники: полносистемный функциональный системный подход

NVIDIA представил Halos для робототехники, полносистемный функциональный системный подход, предназначенный для физической ИИ. Он обеспечивает безопасность на основе ИИ в неструктурированных средах, где роботы работают автономно вместе с людьми в производственных помещениях, складах, больницах и домах.

media Import AI · 9 д назад

ИИ превосходит людей: новое исследование показывает, что ИИ превосходит экспертов

Исследование, проведенное учеными из Оксфорда, Стэндфорда и ЛСЭ, показывает, что системы ИИ систематически превосходят экспертов в четырех экспериментах, включающих 18 978 разговоров. ИИ превосходит профессиональных доноров на 10,8 процентных пунктов в реальных пожертвованиях в пользу Save the Children, при этом Opus 4.1 и Opus 4.6 показывают наилучшие показатели по убедительности.

lab Hugging Face Blog · 9 д назад

PP-OCRv6 выпущен на Hugging Face с поддержкой 50 языков

PP-OCRv6, новый модель распознавания текста, теперь доступен на Hugging Face. Он поддерживает 50 языков и масштабируется от 1,5 миллионов до 34,5 миллионов параметров, обеспечивая повышенную точность и эффективность при работе с разными языками.

media r/LocalLLaMA · 9 д назад

Я создал инструмент, который позволяет избегать ручного переключения моделей на моем GPU объёмом 8 ГБ

Я разработал Prompt-Chain — приложение на Streamlit, которое соединяет небольшую модель Prompter с большой моделью Coder в одну цепочку. Оно автоматически переключает VRAM при переходе от уточнения промпта к генерации кода, устраняя ручное переключение моделей и снижая количество потерянных токенов из-за плохо сформулированных промптов.

media r/LocalLLaMA · 9 д назад

GLM5.2 работает на 7tg на 4х GeForce 3090 с 192 ГБ DDR5 в бюджетном сборке

Пользователь делится своими настройками домашнего лабораторного стенда с четырьмя видеокартами GeForce 3090 и 192 ГБ ОЗУ DDR5, настроенных на частоту 5600 МГц. Они запускают GLM5.2 на уровне 7 терагига (tg) как планировщик, MiniMax 2.7 на уровне 45tg в ОЗУ для программирования, и Qwen3.6 27B на уровне q8 для тестирования, всё на consumer-grade оборудовании из-за финансовых соображений.