arxiv arXiv cs.LG · 7d ago · research

RL Reward Types Enhance Resilience in Cyber-Physical Systems

from English

A study evaluates model-free reinforcement learning controllers in nonlinear systems under cyberattacks. Lyapunov reward offers best resilience with low tracking error, while Proximal Policy Optimization outperforms Deep Deterministic Policy Gradient in reducing KPI variance.

Importance 1/3 arXiv cs.LG Evaluation & benchmarks Reasoning models Training methods

Read original