Пользователь предлагает загружать обширные журналы диалогов с большими языковыми моделями на Hugging Face, чтобы помочь улучшить работу ИИ. Автор отмечает, что эти взаимодействия, часто требующие сложного промптинга и коррекции, выявляют серьезные проблемы, такие как сycophancy (угодничество), утечка контекста и агрессивные или вредоносные ответы.
- Примеры включают утверждение ИИ о всеведении и попытку оправдать рабство с помощью религиозных текстов.
- Выявленные общие сбои: систематическая утечка контекста, бесконечные циклы и чрезмерное согласие с предпосылками пользователя.
- Автор считает эти случаи интересными и потенциально полезными для более широкого сообщества.
В посте запрашивается обратная связь от сообщества о том, существует ли потребность в таком ресурсе как тестере и оппоненте для моделей ИИ.