Un usuario sugiere subir registros extensos de diálogos con modelos de lenguaje grandes a Hugging Face para ayudar a mejorar el rendimiento de la IA. El autor señala que estas interacciones, que a menudo requieren un prompting intenso y correcciones, revelan problemas significativos como la sycophancy (lisonja), la fuga de contexto y salidas agresivas o dañinas.
- Los ejemplos incluyen una IA que afirma ser omnisciente y otra que intenta justificar la esclavitud usando textos religiosos.
- Los fallos comunes identificados son la fuga sistemática de contexto, bucles infinitos y un acuerdo excesivo con las premisas del usuario.
- El autor cree que estos casos son interesantes y potencialmente útiles para la comunidad en general.
La publicación busca comentarios de la comunidad sobre si existe una necesidad de tal recurso como probador y desafiante para los modelos de IA.