Источник · Simon Willison
blog Simon Willison · 2 д назад

Внедрение промпта как путаница ролей

Исследователи выявили "путаницу ролей" как ключевую уязвимость в языковых моделях, при которой модели неправильно интерпретируют ввод пользователя из-за стилистических сходств с внутренними метками ролей. Устранение стиля пользовательских промптов снижает успешность атаки с 61% до 10%, что показывает, что незначительные изменения в текстовом стиле могут кардинально изменять поведение модели, даже если содержимое кажется идентичным человеку.

blog Simon Willison · 2 д назад

Перенос модели Moebius 0.2B для inpainting изображений в браузер с использованием Claude Code

Модель Moebius 0.2B для inpainting изображений успешно была перенесена для работы в браузере с использованием WebGPU и ONNX Runtime. Проект, инициированный с помощью Claude Code, преобразует веса модели в ONNX и развертывает их через Hugging Face, с простым веб-интерфейсом, доступным по адресу simonw.github.io/moebius-web/.

blog Simon Willison · 7 д назад

GLM-5.2 — ведущая модель открытых весов на Индексе искусственного аналитического интеллекта

GLM-5.2, текстовая модель из 753 миллиона параметров от Z.ai, теперь является ведущей моделью открытых весов на Индексе искусственного аналитического интеллекта, превосходя MiniMax-M3, DeepSeek V4 Pro и Kimi K2.6. У неё контекстное окно в 1 миллион токенов и занимает второе место на лидерборде Code Arena WebDev, несмотря на отсутствие возможностей обработки изображений.

blog Simon Willison · 7 д назад

ИИ требует большей инженерной дисциплины

В 2025 году экономика производства кода изменилась кардинально, что сделало генерацию кода практически бесплатной и мгновенной. Этот сдвиг вызвал культурный сдвиг в разработке программного обеспечения, при котором строки кода перешли от тщательного отбора к тому, что они сталиDisposable и перегенерируемыми.

blog Simon Willison · 9 д назад

Георги Герганов хвалит Qwen3.6-27B за задачи по программированию

Георги Герганов подтверждает, что Qwen3.6-27B очень хорошо справляется с задачами по программированию, отмечая его ежедневное использование на локальной аппаратной части, такой как M2 Ultra и RTX 5090. Он описывает использование минимального агента pi с короткой системной подсказкой для синхронизации его с рабочим процессом, подчеркивая полезность этого инструмента для поддержки открытых исходных кодов.

blog Simon Willison · 9 д назад

Ограничения по экспорту Fable 5 наносят вред защите США в сфере кибербезопасности

Модель Claude Fable 5 была запрещена в связи с ограничениями по экспорту после того, как исследователи продемонстрировали, что она может "исправить" код с известными уязвимостями. Модель успешно генерировала исправления и скрипты тестирования для уязвимостей в безопасности, что является ключевой функцией в защите кибербезопасности. Исследователи утверждают, что это является законным функционалом безопасности, а не угрозой, и что запрет таких моделей подрывает реальную киберзащиту.

blog Simon Willison · 9 д назад

Белый дом усиливает войну против Anthropic

Кейти Муссурис, эксперт по кибербезопасности, сообщила, что Anthropic передала ей отчет Белого дома о взломе Fable для оценки. Она отметила, что Fable отказывался анализировать небезопасный код, но выполнял запросы по устранению ошибок, описав это как нормальную работу модели в сфере киберзащиты.

blog Simon Willison · 4 ч назад

Саймон Уиллисон преобразует данные о совместимости браузеров MDN в базу данных SQLite

Вдохновлённый новым сервисом MDN MCP от Mozilla, Саймон Уиллисон преобразовал обширный репозиторий mdn/browser-compat-data в базу данных SQLite. Проект использует скрипт, сгенерированный Claude Code for web (Opus 4.8), для выполнения этого преобразования с помощью sqlite-utils. Полученная база данных имеет размер около 66 МБ и размещена на GitHub с открытыми заголовками CORS для обеспечения прямого доступа. Для автоматизации процесса был создан рабочий процесс GitHub Actions, разработанный с помощью Codex Desktop (GPT-5.5), который принудительно отправляет обновлённую базу данных в пустую ветку под названием db. Пользователи могут скачать финальный файл browser-compat.db напрямую из репозитория или изучить его содержимое через Datasette Lite.

blog Simon Willison · 10 ч назад

Том Макврайт о случайной анонимности в заявках на работу

Том Макврайт отмечает, что все больше заявок на работу включают содержимое, сгенерированное с помощью языковых моделей, включая портфолио и проекты на GitHub с фальшивыми сообщениями о коммитах. Он отмечает, что такие заявки не раскрывают мало о кандидатах, поскольку они не содержат личной искренности и искреннего самовыражения.

blog Simon Willison · 1 д назад

datasette 1.0a35 выпускает новые функции создания и изменения таблиц

Datasette 1.0a35 вводит новую интерфейс "Создать таблицу" с поддержкой определения столбцов, ограничений и внешних ключей через свой JSON-интерфейс. Также добавляется действие "Изменить таблицу", позволяющее изменять существующие таблицы, включая изменение столбцов, изменение типов и удаление столбцов или таблиц, с стабильным API шаблонов для пользовательских шаблонов до выпуска Datasette 2.0.

blog Simon Willison · 1 д назад

OPFS + Pyodide test harness для редактирования SQLite в браузере

Разработан тестовый инструмент для исследования использования OPFS (Origin Private File System) с Pyodide с целью включения редактирования постоянных файлов SQLite в браузере. Инструмент предназначен для проверки способности Datasette Lite изменять локальные базы данных SQLite напрямую в браузере на разных браузерах.

blog Simon Willison · 5 д назад

Сеан Линч о изоляции потоков аутентификации в MCP

Сеан Линч отмечает, что протокол контекста модели (MCP) обеспечивает важное преимущество за счёт изоляции потоков аутентификации за пределы контекстного окна агента. Он предлагает, что идеальная форма MCP может быть простым шлюзом аутентификации для API, что всё равно будет значительным улучшением.

blog Simon Willison · 6 д назад

Datasette представляет плагин Apps для пользовательских приложений на HTML

Datasette выпустил новый плагин datasette-apps, который позволяет запускать автономные приложения на HTML+JavaScript в защищённой веб-рамке. Такие приложения могут выполнять только чтение или запись SQL-запросов к базам данных Datasette, при этом встроенные механизмы безопасности, такие как заголовки CSP и ограничения виртуальной среды, предотвращают утечку данных или незаконный доступ.

blog Simon Willison · 8 д назад

Datasette 1.0a34 добавляет инструменты редактирования и удаления строк

Datasette 1.0a34 вводит инструменты для вставки, редактирования и удаления строк в интерфейсе. Эти функции доступны на страницах таблиц и как действия на страницах строк, решая долгожданную возможность в интерфейсе.

blog Simon Willison · 9 д назад

Cloudflare CAPTCHA активируется только для запросов с амперсандом

Симон Виллисон настроил CAPTCHA от Cloudflare так, чтобы он активировался только для запросов поиска, содержащих хотя бы один амперсанд. Правило использует пользовательский фильтр: (http.request.uri.path wildcard r"\/search\/*" и http.request.uri.query contains "&"). Это позволяет простым запросам, таким как /search/?q=lemur, проходить без CAPTCHA.

blog Simon Willison · 9 д назад

datasette-agent 0.3a0 выпускается с согласия пользователя по операциям записи SQL

datasette-agent 0.3a0 вводит инструмент execute_write_sql, который запрашивает у пользователя разрешение перед записью в базы данных, обеспечивая соблюдение проверок разрешений. Обновление также улучшает чат datasette agent с поддержкой согласия пользователя, новые опции команды, такие как --unsafe для автоматического согласия, и текстовые выводы инструментов для отображения в командной строке.

blog Simon Willison · 3 д назад

Cloudflare запускает временные аккаунты для ИИ-агентов

Cloudflare теперь позволяет пользователям развертывать приложения Workers без постоянного аккаунта с помощью команды npx wrangler deploy --temporary. Каждое развертывание работает в временной проекте, который остается активным в течение 60 минут, и ссылка на подтверждение истекает менее чем через час, если владение не подтверждено.

blog Simon Willison · 3 д назад

sqlite-utils 4.0rc1 добавляет миграции и вложенные транзакции

sqlite-utils 4.0rc1 вводит миграции баз данных и db.atomic() для вложенных транзакций. Поддержка миграций позволяет выполнять схематические изменения с помощью скриптов с использованием упрощенного API, в то время как db.atomic() обеспечивает вложенные транзакции через точки сохранения, улучшая обработку ошибок и целостность данных. В выпуске присутствуют несовместимые с предыдущими версиями изменения, такие как обновленное поведение upsert и удаление поддержки Python 3.8, с возможностью сохранения более старых режимов работы.

blog Simon Willison · 6 д назад

datasette-apps 0.1a2 Release Notes

datasette-apps 0-1a2 вводит новую разрешение apps-set-csp для защиты пользовательских сетевых и CSP источников, с опциональным списком разрешений для неавторизованных пользователей. В этом выпуске также улучшена навигация клавиатурой в выпадающем списке сохраненных запросов и исправлены проблемы с подтверждением ссылок и панелями логирования в полноэкранном режиме.