CloudWatch Alarms

마지막 업데이트: 2026년 2월 20일

목차


CloudWatch Alarms 개요

Amazon CloudWatch Alarms는 AWS 네이티브 모니터링 서비스의 알림 기능입니다. CloudWatch 메트릭을 기반으로 알림을 생성하고, SNS, Lambda, EC2 Auto Scaling 등과 통합하여 자동화된 대응이 가능합니다.

주요 기능

  1. Metric Alarms: 단일 메트릭 기반 알림

  2. Composite Alarms: 여러 알림 조건 조합

  3. Anomaly Detection: 기계 학습 기반 이상 탐지

  4. Alarm Actions: 알림 발생 시 자동 액션 실행

  5. AWS 서비스 통합: EC2, ECS, EKS, Lambda 등과 네이티브 연동

CloudWatch Alarms vs Prometheus Alertmanager

특성
CloudWatch Alarms
Prometheus Alertmanager

유형

AWS 관리형 서비스

오픈소스

데이터 소스

CloudWatch Metrics

Prometheus Metrics

쿼리 언어

CloudWatch Metrics Math

PromQL

비용

알림 수 기반 과금

무료 (인프라 비용만)

복잡한 라우팅

제한적

고급 라우팅 지원

AWS 통합

네이티브

추가 설정 필요


아키텍처

CloudWatch Alarms 동작 흐름

spinner

알림 상태

CloudWatch Alarm은 세 가지 상태를 가집니다:

spinner

Metric Alarms

기본 알림 생성 (Console/CLI)

AWS CLI

알림 구성 요소

파라미터
설명
예시

metric-name

모니터링할 메트릭 이름

CPUUtilization

namespace

메트릭 네임스페이스

AWS/EC2, AWS/EKS

statistic

통계 함수

Average, Sum, Maximum, Minimum, p99

period

평가 주기 (초)

60, 300, 3600

threshold

임계값

80

comparison-operator

비교 연산자

GreaterThanThreshold

evaluation-periods

연속 평가 횟수

2 (2번 연속 초과 시 알림)

datapoints-to-alarm

알림 발생 데이터포인트 수

2 of 3

treat-missing-data

데이터 없을 때 처리

notBreaching, breaching, ignore, missing

비교 연산자

Metrics Math를 사용한 알림

Metrics Math 함수


Composite Alarms

Composite Alarm 개념

Composite Alarm은 여러 개의 Metric Alarm을 조합하여 복잡한 조건을 정의할 수 있습니다.

spinner

Composite Alarm 생성

알림 규칙 문법

알림 억제 패턴


Anomaly Detection

Anomaly Detection 개요

CloudWatch Anomaly Detection은 기계 학습을 사용하여 메트릭의 정상 패턴을 학습하고, 이상치를 탐지합니다.

spinner

Anomaly Detection 알림 생성

Anomaly Detection 설정

모델 학습 기간 조정


SNS 통합

SNS Topic 생성

SNS 메시지 필터링

SNS to Slack 통합 (Lambda)


EventBridge 통합

EventBridge 규칙 생성

자동 대응 구성

spinner

EventBridge 이벤트 패턴

자동 복구 Lambda 예시


Container Insights 알림

EKS Container Insights 메트릭

Container Insights를 활성화하면 EKS 클러스터의 메트릭을 CloudWatch에서 확인할 수 있습니다.

Container Insights 알림 예시

Container Insights 주요 메트릭

메트릭
설명
차원

cluster_node_count

클러스터 노드 수

ClusterName

cluster_failed_node_count

실패한 노드 수

ClusterName

node_cpu_utilization

노드 CPU 사용률

ClusterName, NodeName

node_memory_utilization

노드 메모리 사용률

ClusterName, NodeName

node_filesystem_utilization

노드 디스크 사용률

ClusterName, NodeName

pod_cpu_utilization

파드 CPU 사용률

ClusterName, Namespace, PodName

pod_memory_utilization

파드 메모리 사용률

ClusterName, Namespace, PodName

pod_number_of_container_restarts

컨테이너 재시작 횟수

ClusterName, Namespace, PodName

service_number_of_running_pods

서비스별 실행 중인 파드 수

ClusterName, Namespace, Service


CloudWatch Alarm Actions

EC2 Actions

Auto Scaling Actions

Systems Manager Actions


비용 최적화

비용 요소

항목
비용

Standard Resolution 알림 (60초)

월 $0.10/알림

High Resolution 알림 (10초)

월 $0.30/알림

Anomaly Detection

월 $0.30/메트릭

Composite Alarm

월 $0.50/알림

비용 최적화 전략

spinner

권장 설정

알림 정리 스크립트


Prometheus 메트릭 연동

Amazon Managed Prometheus (AMP) 연동

AMP의 메트릭을 CloudWatch에서 알림으로 사용할 수 있습니다.


Terraform 예시

기본 알림

Metrics Math 알림

Composite Alarm

EKS Container Insights 알림

Anomaly Detection 알림


퀴즈

이 장에서 배운 내용을 테스트하려면 CloudWatch Alarms 퀴즈를 풀어보세요.

마지막 업데이트