Usuário propõe compartilhar diálogos de falhas de IA no Hugging Face

Um usuário sugere carregar registros extensos de diálogos com modelos de linguagem grandes para o Hugging Face para ajudar a melhorar o desempenho da IA. O autor observa que essas interações, frequentemente exigindo prompts intensos e correções, revelam problemas significativos como sycophancy (lisonja), vazamento de contexto e saídas agressivas ou prejudiciais.

Exemplos incluem uma IA afirmando ser onisciente e outra tentando justificar a escravidão usando textos religiosos.
Falhas comuns identificadas são o vazamento sistemático de contexto, loops infinitos e acordo excessivo com as premissas do usuário.
O autor acredita que esses casos são interessantes e potencialmente úteis para a comunidade em geral.

A postagem busca feedback da comunidade sobre se há necessidade de tal recurso como testador e desafiante para modelos de IA.