BIM-Edit presenta un benchmark para evaluar modelos de lenguaje grandes en la edición de Modelos de Información de Construcción en formato IFC mediante lenguaje natural. Incluye 324 tareas de edición en 11 modelos de edificios reales y 36 sintéticos, evaluando precisión geométrica, validez semántica y consistencia topológica. El mejor modelo alcanza solo un puntaje promedio del 49.5%, sin que ningún modelo resuelva más del 3.4% de las tareas, lo que destaca una brecha significativa en las capacidades de los LLMs para flujos de trabajo de diseño de ingeniería.