PETRA transforma textos públicos de la web en un corpus curado de ingeniería petrolera con supervisión sintética para recuperación densa y reordenamiento. Mejora el nDCG in-domain de 0.703 a 0.763 y aumenta el rendimiento en el benchmark de Earth Science en un 44% y en un panel de razonamiento de seis tareas en un 23%.