Компания Amazon Web Services (AWS), являющаяся лидером на рынке облачной инфраструктуры, сообщила в понедельник о серьезном инциденте, в результате которого многие известные веб-сайты были парализованы. В 2:01 ночи по тихоокеанскому времени AWS указала в объявлении об обновлении, что эта «операционная проблема» затронула «несколько сервисов», и заявила, что «ускоряет процесс восстановления по нескольким параллельным путям». На данный момент пострадало около 70 собственных служб.



Вскоре после этого AWS заявила, что заметила «значительные признаки восстановления».

«В настоящее время большинство запросов должны обрабатываться в обычном режиме. Мы все еще работаем над накопившимися запросами в очереди и продолжим предоставлять новые обновления», — добавлено в объявлении.

Некоторые услуги были восстановлены в 3:03 утра по тихоокеанскому времени. В AWS заявили: «Мы можем подтвердить, что глобальные сервисы и функции, зависящие от региона US-EAST-1, также были восстановлены. Мы продолжим работу над комплексным восстановлением и будем обновлять по мере поступления дополнительной информации».

Платформа мониторинга неисправностей Downdetector показывает, что затронутые платформы, о которых сообщили пользователи, включают Amazon, Disney+, Lyft, приложение McDonald's, официальный сайт New York Times, Reddit, Ring (бренд умной безопасности), Robinhood (платформа для торговли акциями), Sarab, T-Mobile (оператор связи), United Airlines (United Airlines), Venmo (платежное приложение) и Verizon (оператор телекоммуникаций).

Некоторые пассажиры United Airlines и Delta Air Lines заявили в социальных сетях, что не могут проверить информацию о бронировании, зарегистрироваться или сдать багаж онлайн.

Другие пользователи социальных сетей заявили, что в облачных играх, таких как «Robulus» и «Fortnite», наблюдались перебои в обслуживании; Криптовалютная биржа Coinbase заявила, что многие пользователи не смогли получить доступ к ее платформе из-за этого сбоя.

Инструмент графического дизайна Canva заявил: «Текущая частота ошибок платформы значительно возросла, что повлияло на нормальное использование функций Canva. Эта проблема связана с серьезным сбоем нашего базового поставщика облачных услуг (т. е. AWS)».

Также пострадал инструмент поиска искусственного интеллекта Perplexity. Ее генеральный директор Аравинд Сринивас написал на платформе X (ранее Twitter): «Основная причина проблемы — сбой AWS, и мы прилагаем все усилия, чтобы ее решить».

Это не первый случай, когда крупные компании страдают от технических сбоев. В июле 2024 года ошибка обновления программного обеспечения, допущенная компанией по кибербезопасности CrowdStrike, выявила хрупкость мировой технологической инфраструктуры: ошибка парализовала системы Microsoft Windows, вызвав хаос на миллионы долларов, остановив тысячи рейсов и повлияв на нормальную работу больниц и банков.