Más allá de las formas superficiales: Una taxonomía integral y orientada a mecanismos de codificación lingüística indirecta para la detección de lenguaje codificado basado en LLM

Los investigadores proponen una taxonomía orientada a mecanismos de expresiones lingüísticas indirectas (ILE) para categorizar las operaciones subyacentes utilizadas para codificar y recuperar significado en el lenguaje codificado. Este enfoque se abstrae de los objetivos comunicativos para centrarse en los mecanismos específicos de codificación encontrados en el algospeak, los eufemismos y la ofuscación adversarial.

La taxonomía fue evaluada incorporándola en prompts de LLM junto con cuatro taxonomías existentes y una línea base sin taxonomía.
Las pruebas utilizaron 2.000 publicaciones anotadas manualmente de TikTok y Bluesky para evaluar el rendimiento en tres modelos de lenguaje grandes diferentes.
El método propuesto logró el mejor rendimiento a nivel de documento y de segmento, mejorando la precisión en un 4,7 % y la puntuación F1 en un 5,4 % sobre el benchmark de mejor rendimiento.

Los resultados demuestran que una taxonomía integral y orientada a mecanismos sirve como un andamio estable para detectar lenguaje codificado emergente y proporciona información útil para los sistemas de moderación de contenido.