18 ноября в сети Cloudflare произошел масштабный сбой, из-за которого тысячи сайтов по всему миру выдавали ошибки. В компании объяснили, что работу сервисов парализовала техническая ошибка, не связанная с кибератакой.
Об этом сообщается на сайте Cloudflare.
Во вторник днем в глобальной сети Cloudflare произошел серьезный сбой, который привел к массовому падению сайтов и сервисов, использующих эту инфраструктуру. Пользователи видели страницы с ошибками, а некоторые сервисы, включая Turnstile и часть Dashboard, вообще не работали.
В компании объяснили, что проблема не была кибератакой, а возникла из-за изменения в системе разрешений одной из баз данных. В результате база сформировала файл конфигурации для системы Bot Management, который случайно удвоился в размере и вызвал сбой на всех серверах сети. Прокси-системы Cloudflare не смогли обработать файл такого размера, что привело к панике программного обеспечения и массовым ошибкам.
Файл обновлялся каждые пять минут, из-за чего сеть периодически восстанавливалась и снова выходила из строя. Только после того, как инженеры остановили распространение поврежденного файла и вернули предыдущую версию, трафик начал стабилизироваться. В 14:30 работу основных сервисов удалось восстановить, а полное восстановление инфраструктуры завершилось в 17:06.
В Cloudflare извинились за инцидент и заявили, что работают над усилением защиты от подобных сбоев. Компания подчеркнула, что любая остановка ее сети является «неприемлемой», учитывая ее роль в глобальной интернет-инфраструктуре.
