Apostate вводит новый оператор контрастного ковекторного редактирования, определенный как E = I − R Dᵀ. Метод устраняет поведение отказа, изолируя вредные варианты, при этом сохраняя безвредное поведение за счет тренировки предиктора W на безвредных активациях и подавления его на вредоносных запросах. На granite-3.3-8b он снижает процент отказов с 96,0% до 5,0% при увеличении безвредной дивергенции КЛ на 0,081 нат.