Failover ist das automatische Umschalten auf ein redundantes Ersatzsystem, wenn das primäre System ausfällt. Ziel ist eine möglichst kurze oder gar keine Unterbrechung des Dienstes.
Failover-Mechanismen kommen auf allen Ebenen zum Einsatz: Netzwerk (redundante Leitungen, HSRP/VRRP), Server (Cluster mit Hot-Standby), Speicher (RAID, replizierte Datenbanken) und Anwendung (Load Balancer mit Health Checks). Die Failover-Zeit beeinflusst direkt das RTO (Recovery Time Objective) im Disaster-Recovery-Plan. Automatisches Failover erfordert regelmäßige Tests — ein Failover, das im Ernstfall nicht funktioniert, ist wertlos.