G-IdiomAlign introduce un benchmark con pivote de glosa que utiliza glosas en inglés de Wiktionary para anclar los modismos. Incluye protocolos de equivalencia de opción múltiple controlada y generación contrastiva de glosas, mostrando que las glosas mejoran el rendimiento en la alineación semántica basada en embeddings, aunque los resultados siguen siendo modestos, lo que indica un potencial significativo de mejora en la generación de modismos multilingües.