Мониторинг 24/7 — это постоянное непрерывное наблюдение за основными показателями работы выделенного сервера (Dedicated).
Цели мониторинга
Системы мониторинга дают возможность контролировать непрерывную работу сервера и предотвращать аварии и инциденты до того, как конечный пользователь заметит последствия сбоя.
Мониторинг отслеживает следующие параметры:
- температуру процессора, жёстких дисков, оперативной памяти;
- состояние оперативной памяти (свободная, используемая приложениями, кеш-память);
- работу сервера баз данных;
- работу веб-сервера;
- работу RAID-массивов;
- работу сетевых интерфейсов;
- параметры работы самой операционной системы и др.
Классы уведомлений систем мониторинга:
- Информационные — поступают при успешной проверке работы сервиса.
- Предупреждения — обозначают пограничные состояния: сервис доступен, но его работа вызывает подозрения.
- Критические — обозначают события, которые требуют срочного реагирования: работа сервера нарушена.
По типу установки системы мониторинга делятся на два вида:
-
1
Системы, которые устанавливаются непосредственно на сервер, который мониторится. Их преимущество — простота настройки и администрирования.
Недостатки такой настройки мониторинга сервера:
- При выходе из строя сервера, система мониторинга автоматически перестаёт работать.
- Система мониторинга потребляет ресурсы самого сервера, снижая его производительность.
- 2 Клиент-серверные системы мониторинга. На наблюдаемый сервер устанавливается программный агент. Он собирает информацию о работе сервера клиента и пересылает её на сервер мониторинга. Сервер мониторинга анализирует, визуализирует и сохраняет полученную информацию. Если возникает неисправность — оперативно уведомляет о ней. Большинство таких систем сохраняют историю работы сервера. Преимущества клиент-серверных систем — надёжность и сохранность ресурсов. Наблюдение за сервером продолжается даже при его выходе из строя, а ресурсы на наблюдаемом сервере не потребляются. Недостаток таких систем — сложность настройки и администрирования.
Развитие систем мониторинга
Большинство систем мониторинга при работе накапливают только текущие данные. Однако с развитием искусственного интеллекта получают распространение обучаемые системы мониторинга.
Система обучается по следующему принципу:
- 1. Происходит инцидент.
- 2. Данные мониторинга за несколько часов до инцидента изымаются, анализируются и записываются.
- 3. При повторном получении подобных параметров и показателей система мониторинга сервера уведомит, что дальнейшее развитие событий может снова создать этот инцидент. Так можно предупредить и вовремя предотвратить сбой.
Система мониторинга выделенных серверов в Рег.ру
Для выделенных серверов в Рег.ру мы применяем обе системы мониторинга и все перечисленные классы уведомлений. Основу системы мониторинга составляют программный комплекс Zabbix и модули, разработанные и созданные специалистами нашей компании. Для анализа работы каждого сервера мы используем более 50-ти параметров.
Технические специалисты получают уведомления мгновенно, сразу по нескольким каналам связи. Мы начинаем действовать на этапе предупреждения, не дожидаясь, когда ситуация станет критической.
При необходимости привлекаем к устранению инцидента узконаправленных специалистов: инженеров в центрах обработки данных, специалистов по системам резервного копирования, системных администраторов, специалистов по сетям передачи данных.
Мы разбираем и обсуждаем каждый инцидент и принимаем меры, чтобы он не повторился. Специалисты работают без выходных и праздников.
С нашей системой мониторинга ваш сервер будет всегда под наблюдением компетентных специалистов.
Помогла ли вам статья?
Спасибо за оценку. Рады помочь 😊