На рассвете 2023-10-20 в облачной платформе Amazon Web Services произошёл сбой, затронувший тысячи пользователей. Проблемы начались около 12:00 ET и достигли пика к 3:00 ET.
Масштабный сбой в облачной платформе
Область воздействия
Сбой был сосредоточен в US-EAST-1 (Северная Вирджиния), крупнейшем дата-центре AWS. По данным Downdetector, более 13,000 пользователей испытали перебои между 4:00 и 12:00 ET.
- AWS заявил, что виной стала ошибка во внутренней системе мониторинга.
- Инцидент вызвал возросшие ошибки API и увеличенные задержки.
- Прошлогодний сбой затронул банки и аэропорты.
- Начались шаги по исправлению и валидации ошибок EC2.
- Приложения, включая Snapchat, медленно восстанавливаются.
Последствия и выводы
Сбой показал, насколько интернет зависит от одной крупной облачной платформы. Общественное мнение, включая комментарии от илона Маска, призвало к укреплению стратегий по много-облачности и повышению уровня шифрования.
Резкое увеличение ошибок напомнило о важности распределения рисков для критически важных операций.