Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Требования к аппаратному комплексу может отличаться, в зависимости от приложений, которые запущены на сервере либо VM, а так же также интенсивности использования проложения. Исправная операционная система, работающая поверх инфраструктуры, имеет решающее значение для поддержания стабильности всего комплекса приложений. Раннее выявление всплесков использования ресурсов, позволяет предотвратить возможные инциденты в будущем. 

...

  • CPU - При выполнении сложных запросов, база данных максимально утилизирует процессорное время. Мониторинг должен следить, чтобы загрузка CPU не превышала 80% дольше 5 минут. Если очень часта часто наблюдается загрузка 80% и выше, то необходимо подключиться к анализу запросов либо увеличить количество ядер на сервере.
  • RAM - Большие и сложные запросы используют оперативную память для формирования ответа. Поэтому необходимо мониторить, чтобы объем занятой RAM не превышал 85%. Обратите внимание, что существует такие понятия, как used memory и cached memory. Cached memory временно используется и автоматически освобождается. Вам необходимо мониторить именно used memory (это же касается и других сервисов, где будет идти речь о мониторинге оперативной памяти).
  • Disk - Когда речь заходит идет о дисках под базой данных, то важным является задержка чтения\/записи на диск (disk latency). Медленный диск - означает медленную базу работу базы данных, и это влияет абсолютно на все приложения Webitel. Что касается свободного места на диске, то больше 90% занятого места - является критическим сигналом.

Хорошей практикой является использование репликации базы данных для работы с аналитическими отчётами (Grafana либо другой внешний сервисдругого внешнего сервиса)

Consul и RabbitMQ

Для определения сервисов и обмена сообщениями, сервисы Webitel используют Consul и RabbitMQ. Основные критерии мониторинга ресурсов:

  • CPU - Загрузка на каждое ядро CPU не должна превышала 80% дольше 1 минуты.
  • RAM - Объем занятой RAM не должен превышать 80%.
  • Disk - Как и с базой данных — задержка чтения\/записи на диск (disk latency) влияет на быстродействие всего комплекса приложений. Важно не забывать о мониторинге свободного места на диске, которое никогда не должно опускаться ниже 5% от общего объема диска либо меньше 5Gb.

...