Datadog
목차
소개
주요 특징
특징
설명
Datadog vs 오픈소스 vs CloudWatch
항목
Datadog
CloudWatch
Prometheus+Grafana
EKS 통합 아키텍처
전체 아키텍처
구성 요소
구성 요소
역할
Datadog Agent 설치
Helm을 사용한 설치
values.yaml
IRSA 설정 (선택사항 - AWS 통합용)
인프라 모니터링
자동 수집 메트릭
커스텀 메트릭 수집
Prometheus 어노테이션 기반
DogStatsD 사용
서비스 디스커버리
APM 및 분산 트레이싱
자동 계측 설정
수동 계측 (Java)
수동 계측 (Python)
서비스 맵
로그 관리
자동 로그 수집
파드별 로그 설정
로그 파이프라인
트레이스-로그 연결
대시보드 및 알림
대시보드 생성 (API)
모니터(알림) 설정
Watchdog AI
비용 구조
요금제 개요
플랜
인프라
APM
로그
특징
비용 계산 예시
비용 최적화 전략
1. 메트릭 최적화
2. 로그 최적화
3. APM 샘플링
모범 사례
1. 태깅 전략
2. 알림 계층화
3. SLO 설정
문제 해결
일반적인 문제
1. Agent가 메트릭을 전송하지 않음
2. APM 트레이스 누락
3. 로그 수집 안됨
디버깅 명령어
참고 자료
퀴즈
마지막 업데이트