Новая теория моделирует, как семантические перефразы могут обмануть классификаторы финансовых эмоциональных оценок, анализируя наихудшее смещение представлений целевых моделей. Индекс атакоспособности λ*(x) получается из наибольшего обобщённого собственного значения матричной пары (A,B), что обеспечивает закрытые формулы прогнозов и сертификаты устойчивости для аффинных выходов. Фреймворк связывает теорию непрерывных возмущений с дискретным поиском перефраз, с эмпирической проверкой на реальных классификаторах финансовых текстов.
Общая геометрия собственных значений семантических атак
Переведено с English → Русский