Gestión de la cardinalidad del mapa en el mapeo automático de clasificación de enfermedades

El artículo presenta un método novedoso para el mapeo automático entre sistemas de clasificación de enfermedades, como ICD-9-CM e ICD-10-CM, que aborda las limitaciones de los enfoques basados en embeddings existentes, los cuales a menudo pasan por alto escenarios complejos de uno a muchos. Al emplear un pipeline de bloqueo y coincidencia inspirado en la resolución de entidades, los autores utilizan modelos de lenguaje grandes (LLM) para identificar mapeos válidos dentro de bloques candidatos.

El método genera un bloque de coincidencias candidatas mediante el bloqueo y utiliza un LLM para la coincidencia dentro de cada bloque.
Equilibra las compensaciones inherentes entre precisión, exhaustividad y cobertura del mapeo que se encuentran en los métodos basados en umbrales y top-K.
Los resultados empíricos muestran una mayor precisión con una exhaustividad comparable y una cobertura más amplia en los pares ICD-9-CM↔ICD-10-CM e ICD-10-AM↔ICD-11.

Este enfoque ayuda a los usuarios a integrar datos de salud y realizar análisis longitudinales al proporcionar mapeos más precisos y completos entre diferentes códigos de clasificación de enfermedades.