一位用户建议将大型语言模型的广泛对话日志上传到 Hugging Face,以帮助提升 AI 性能。作者指出,这些交互通常需要进行大量的提示和纠正,揭示了诸如阿谀奉承(sycophancy)、上下文泄漏以及具有攻击性或有害的输出等严重问题。

  • 示例包括一个 AI 声称全知全能,另一个试图利用宗教文本为奴隶制辩护。
  • 已识别的常见故障包括系统性上下文泄漏、无限循环以及对用户前提的过度认同。
  • 作者认为这些案例有趣且对更广泛的社区可能有用。

该帖子寻求社区反馈,询问是否确实需要这样一个资源作为 AI 模型的测试者和挑战者。