Постоянные работы
Круглосуточный мониторинг Link to heading
Доступность сайта проверяется автоматически каждую минуту (для части клиентов — каждые три минуты по согласованным условиям). При недоступности ресурса формируется оповещение, и я реагирую вне зависимости от времени суток: провожу первичную диагностику, определяю причину сбоя и выполняю необходимые восстановительные действия.
На сервере (виртуальном или выделенном) ведется постоянный мониторинг ключевых параметров:
- загрузка CPU и системных ресурсов
- использование оперативной памяти
- свободное место на дисках и файловых системах
- состояние RAID и файловых систем
- работа критичных сервисов и демонов (web-сервер, БД, почтовые службы, прокси, VPN и др.)
- состояние SSL и срок действия сертификатов
- базовые сетевые показатели и доступность портов
При отклонениях от нормальных значений формируются автоматические уведомления и выполняется оперативная реакция.
Мониторинг приложений и сервисов Link to heading
Дополнительно контролируется корректность работы прикладных сервисов:
- проверка ответов web-приложений и API
- контроль кодов ответа HTTP
- выборочные проверки контрольных URL
- отслеживание некорректных ответов reverse proxy и backend-сервисов
- выявление зацикленных процессов и утечек памяти
При необходимости выполняется автоматический перезапуск сервисов или ручное вмешательство.
Бэкапирование Link to heading
Резервное копирование выполняется автоматически:
- ежедневные бэкапы баз данных
- ежедневные бэкапы файлов сайта и конфигураций
- отдельное резервирование критичных конфигурационных файлов сервера
Копии сохраняются:
- локально на сервере
- на независимое удаленное хранилище (европейская площадка)
- на дополнительную независимую точку хранения
Таким образом используется схема с несколькими географически разнесенными копиями.
Минимум раз в месяц проводится проверка и валидация резервных копий с тестовым восстановлением, чтобы гарантировать их целостность и пригодность к использованию.
Работает мониторинг задач резервного копирования: если бэкап не выполнялся более суток, формируется оповещение о проблеме.
Обновления и управление безопасностью Link to heading
- автоматическая установка критичных обновлений безопасности
- регулярные плановые обновления пакетов в рамках используемого дистрибутива
- контроль изменений версий ключевого серверного ПО
- проверка совместимости обновлений с установленным стеком
- поэтапное обновление без массовых одновременных рисковых изменений
Мониторинг уязвимостей Link to heading
Постоянно отслеживаются специализированные рассылки и базы уязвимостей по используемому ПО и серверным компонентам. При появлении значимых уязвимостей:
- оценивается уровень риска
- принимается решение о срочном обновлении или временных мерах защиты
- при необходимости внедряются обходные защитные меры до выхода патча
HTTPS и сертификаты Link to heading
- автоматическое продление TLS/SSL сертификатов
- обновление выполняется заранее (примерно за 30 день до истечения)
- контроль успешности перевыпуска
- проверка корректности установки цепочек сертификатов
Управление доступами Link to heading
- работа с SSH-доступами и ключами
- централизованное управление ключами доступа
- оперативное добавление и удаление ключей
- отключение устаревших и неиспользуемых доступов
- аудит прав доступа при изменениях состава пользователей
Защита и сетевой периметр Link to heading
- настройка firewall и сетевых политик
- базовая защита от сканирований и перебора
- интеграция с WAF и внешними защитными сервисами (при использовании)
- ограничение административных интерфейсов
- журналирование попыток доступа
Диагностика и разбор инцидентов Link to heading
При сбоях и нестандартном поведении выполняется:
- анализ логов
- поиск первопричины
- устранение не только симптома, но и источника проблемы
- документирование нетипичных инцидентов для предотвращения повторов
Конфигурационное сопровождение Link to heading
- поддержание серверных конфигураций в аккуратном и воспроизводимом состоянии
- хранение и версионирование конфигураций
- аккуратное внесение изменений без хаотичных правок “на живую”
- минимизация ручных и неотслеживаемых изменений