El artículo presenta un método novedoso para el mapeo automático entre sistemas de clasificación de enfermedades, como ICD-9-CM e ICD-10-CM, que aborda las limitaciones de los enfoques basados en embeddings existentes, los cuales a menudo pasan por alto escenarios complejos de uno a muchos. Al emplear un pipeline de bloqueo y coincidencia inspirado en la resolución de entidades, los autores utilizan modelos de lenguaje grandes (LLM) para identificar mapeos válidos dentro de bloques candidatos.
- El método genera un bloque de coincidencias candidatas mediante el bloqueo y utiliza un LLM para la coincidencia dentro de cada bloque.
- Equilibra las compensaciones inherentes entre precisión, exhaustividad y cobertura del mapeo que se encuentran en los métodos basados en umbrales y top-K.
- Los resultados empíricos muestran una mayor precisión con una exhaustividad comparable y una cobertura más amplia en los pares ICD-9-CM↔ICD-10-CM e ICD-10-AM↔ICD-11.
Este enfoque ayuda a los usuarios a integrar datos de salud y realizar análisis longitudinales al proporcionar mapeos más precisos y completos entre diferentes códigos de clasificación de enfermedades.