Помню, как админил целый день, пытаясь понять...
Эх, вот раньше-то было время, когда каждый новый сервер казался настоящим приключением. Помнится, как сейчас, наш первый масштабный проект, где мы использовали несколько VDS для распределения нагрузки. Это было лет десять (а может и больше!) назад, когда облачный хостинг ещё не был таким мейнстримом, как сейчас.
Надо было развернуть новую версию нашего приложения. Я, молодой и амбициозный, решил, что сделаю все максимально эффективно. Настроил пару виртуальных серверов, база данных на отдельном VDS, веб-серверы на других. Вроде все по уму, всё по книжкам.
И вот, наступает день запуска. Постепенно переключаю трафик. Сайт загружается, первые пользователи заходят. Все вроде бы идет гладко. Но потом… потом началось.
Сервера начинают отваливаться один за другим. Медленная загрузка, ошибки 502, 503. Реально, паника! Сижу, смотрю на мониторинг, а там кривая падает вниз, как будто кто-то вирус запустил. Я тогда еще плохо разбирался в нюансах файрволов и тонкостях сетевой конфигурации, особенно когда речь шла о взаимодействии нескольких VPS.
Потратил часов шесть, наверное, пытаясь найти причину. Перезагружал, логи смотрел, настройки менял. Уже начал думать, что проблема в самом хостере, что они нам плохие виртуальные серверы подсунули. Но ведь раньше все работало!
Короче, оказалось всё до банального просто. Один из наших разработчиков, в спешке, добавил новую строчку в конфиг веб-сервера, а потом забыл добавить соответствующее правило в файрволе для одного из VDS. Ну и трафик стал идти куда-то не туда, забивая порт и вызывая отказ в обслуживании. Как вспомню — так вздрогну. С тех пор я всегда проверяю не только конфиги, но и правила файрвола по три раза. А ведь тогда казалось, что я самый умный, раз уж берусь за такое.