Este artículo aborda el problema de resolver entidades en conjuntos de datos grandes utilizando un oracle que agrupa registros en lotes limitados, con el objetivo de lograr un enfoque de pago por uso para controlar los costos mientras se maximiza la recuperación.

  • El problema se formula formalmente como resolución de entidades por lotes, y se demuestra que seleccionar los lotes óptimos es NP-duro.
  • Se proporciona una solución óptima bajo la condición natural de conocer los tamaños de las entidades.
  • El enfoque propuesto se evalúa en seis conjuntos de datos, demostrando su superioridad frente a las líneas base más avanzadas.