Part 2: Observability 스택
학습 목표
아키텍처 개요
Step 2.1: OpenTelemetry Collector 배포
OTel Collector 아키텍처
배포 모드
역할
위치
# Managed Cluster로 전환
kubectl config use-context managed
# cert-manager 설치 (OTel Operator 의존성)
kubectl apply -f https://github.com/cert-manager/cert-manager/releases/download/v1.14.4/cert-manager.yaml
# cert-manager Ready 대기
kubectl wait --for=condition=Available deployment/cert-manager -n cert-manager --timeout=300s
kubectl wait --for=condition=Available deployment/cert-manager-webhook -n cert-manager --timeout=300s
# OTel Operator 설치
kubectl apply -f https://github.com/open-telemetry/opentelemetry-operator/releases/latest/download/opentelemetry-operator.yaml
# Operator Ready 대기
kubectl wait --for=condition=Available deployment/opentelemetry-operator-controller-manager -n opentelemetry-operator-system --timeout=300sStep 2.2: Metrics 스택 배포
2.2.1 kube-prometheus-stack (Prometheus + Alertmanager + Grafana)
2.2.2 VictoriaMetrics
2.2.3 Mimir
2.2.4 CloudWatch Metrics (ADOT)
Step 2.3: Logging 스택 배포
2.3.1 Loki (SimpleScalable mode)
2.3.2 ClickHouse
2.3.3 OpenSearch (FluentBit)
2.3.4 CloudWatch Logs (FluentBit)
Step 2.4: Tracing 스택 배포
2.4.1 Tempo
2.4.2 X-Ray (OTel Collector Exporter)
Step 2.5: Visualization 구성
2.5.1 Grafana Datasource Provisioning
2.5.2 Amazon Managed Grafana 설정
2.5.3 Exemplar 설정
Step 2.6: Alerting 기본 구성
2.6.1 Alertmanager + SNS Receiver
2.6.2 Grafana OnCall 설치
2.6.3 CloudWatch Alarms
검증 (Verification)
Observability 스택 상태 확인
Grafana Explore 테스트
확인 항목
Datasource
테스트 쿼리
예상 결과
컴포넌트
Pod 수
상태
참조 문서
다음 단계
마지막 업데이트