Un nuevo marco de aprendizaje in-contexto multi-tarea permite inferencia bayesiana jerárquica amortizada representando la información previa como un prefijo en los conjuntos de datos. El modelo transformer adapta las predicciones entre familias previas, igualando el rendimiento óptimo en diversas tareas mientras es significativamente más rápido. Se valida en la predicción de temperatura espaciotemporal del mundo real.