DevOps – Cảnh báo giám sát

Các đối tượng cần giám sát

STTĐối tượngThông số giám sátTiêu chí giám sátTham khảo 
1ServerCPU
RAM
HDD
Network (bandwidth)
IO
UP/DOWN
Load average
CPU
RAM
HDD
Bandwidth
IO
https://github.com/prometheus/node_exporter
2Docker containerCPU
RAM
HDD
Network (bandwidth)
IO
UP/DOWN
CPU
RAM
HDD
Bandwidth
IO
3URLHttp statusUP(200)/DOWN(5xx)https://github.com/prometheus/blackbox_exporter
4NginxActive connection
Accepts
Handled
Requests
Reading
Writting
Waiting
?https://github.com/vozlt/nginx-module-vts
https://github.com/hnlq715/nginx-vts-exporter
5MySQLUP/DOWN
SQL connections (>75% max_connection)
https://github.com/prometheus/mysqld_exporter
6RedisUP/DOWNhttps://github.com/oliver006/redis_exporter
7RabbitMQUP/DOWN
Tồn queue:
– queue có >100 messages trong 1 phút → YELLOW
– queue có >100 messages trong 5 phút → ORANGE
– queue có >100 mesages trong 10 phút → RED
https://github.com/kbudde/rabbitmq_exporter
8DB ClusterGiám sát đồng bộ dữ liệu giữa các instance?

Các mức cảnh báo

STTMức cảnh báoĐiều kiệnKênh cảnh báo 
1GREENKhi dịch vụ UP & tiêu chí giám sát < 70%N/A
2YELLOWKhi dịch vụ UP & tiêu chí giám sát vượt 70% (vd: ổ cứng đầy quá 70%)Email
3ORANGEKhi dịch vụ UP & tiêu chí giám sát vượt 80%Email, Slack
4REDKhi dịch vụ DOWN hoặc tiêu chí giám sát vượt 90%Email, Slack, SMS

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *