CANDLE es un sistema ligero que utiliza Clasificación Temporal Conectiva para deduplicar caracteres repetidos en texto árabe, sin depender de reglas manuales ni analizadores morfológicos. Logra una Tasa de Error de Oración del 5.37% y reduce la fertilidad del tokenizador hasta en un 12.8%, disminuyendo los costos de inferencia y mejorando el uso de la ventana de contexto.