Alerting
목차
알림의 역할과 중요성
관측성 3대 축에서 알림의 위치
알림이 필요한 이유
좋은 알림 vs 나쁜 알림
구분
좋은 알림
나쁜 알림
알림 생명주기
1. Detection (감지)
2. Notification (알림)
3. Escalation (에스컬레이션)
4. Resolution (해결)
알림 설계 원칙
1. Actionable Alerts (실행 가능한 알림)
2. Alert Fatigue 방지 (알림 피로 방지)
3. Severity Levels (심각도 수준)
심각도
설명
대응 시간
예시
4. 알림 문서화
알림 라우팅과 에스컬레이션
라우팅 전략
라우팅 트리 설계
에스컬레이션 정책
단계
시간
대상
채널
온콜 로테이션
온콜의 개념
온콜 모범 사례
온콜 도구 요구사항
EKS 환경에서의 알림 전략
EKS 특화 알림 영역
계층별 알림 전략
1. 클러스터 수준 알림
2. 워크로드 수준 알림
3. 리소스 수준 알림
AWS 서비스 통합 알림
AWS 서비스
모니터링 항목
알림 도구
솔루션 비교
주요 알림 솔루션 비교표
기능
Alertmanager
CloudWatch Alarms
Grafana OnCall
PagerDuty
OpsGenie
솔루션 선택 가이드
상황별 권장 솔루션
하이브리드 접근법
다음 단계
참고 자료
마지막 업데이트