Este estudio investiga la incongruencia entre las calificaciones por estrellas y los sentimientos expresados en las reseñas escritas dentro de las reseñas de atracciones turísticas de Sri Lanka. Analizando un conjunto de datos de 16,156 reseñas desde 2010 hasta 2023, los investigadores emplearon una pipeline basada en transformers para derivar el sentimiento textual independientemente de las calificaciones asignadas. El análisis revela que el 18.6% de las reseñas presentan incongruencia, impulsada principalmente por comportamientos de Calificador Conservador y de 5 Estrellas Obligatorio. Estas discrepancias varían según el tipo de recinto, con los museos mostrando las tasas más altas de divergencia. Las pruebas estadísticas, la regresión logística, Random Forest y el análisis SHAP identifican el tipo de recinto, la experiencia del revisor, la longitud de la reseña y los factores temporales como contribuyentes clave a este fenómeno. Los hallazgos demuestran que las calificaciones por estrellas no son intercambiables con el sentimiento textual y requieren validación antes de ser utilizadas como etiquetas ground-truth en tareas de NLP.