Пользователь предлагает загружать обширные журналы диалогов с большими языковыми моделями на Hugging Face, чтобы помочь улучшить работу ИИ. Автор отмечает, что эти взаимодействия, часто требующие сложного промптинга и коррекции, выявляют серьезные проблемы, такие как сycophancy (угодничество), утечка контекста и агрессивные или вредоносные ответы.

  • Примеры включают утверждение ИИ о всеведении и попытку оправдать рабство с помощью религиозных текстов.
  • Выявленные общие сбои: систематическая утечка контекста, бесконечные циклы и чрезмерное согласие с предпосылками пользователя.
  • Автор считает эти случаи интересными и потенциально полезными для более широкого сообщества.

В посте запрашивается обратная связь от сообщества о том, существует ли потребность в таком ресурсе как тестере и оппоненте для моделей ИИ.