Datadog

마지막 업데이트: 2026년 2월 20일

목차

소개

Datadog은 클라우드 규모의 인프라, 애플리케이션, 로그를 모니터링하는 통합 관측성 플랫폼입니다. SaaS 모델로 제공되어 인프라 관리 없이 강력한 모니터링 기능을 사용할 수 있습니다.

주요 특징

특징
설명

통합 플랫폼

메트릭, 로그, 트레이스, 프로파일링 통합

750+ 통합

AWS, Kubernetes, 데이터베이스 등 광범위한 통합

자동 계측

APM Auto-instrumentation 지원

AI 기반 분석

Watchdog AI로 자동 이상 탐지

실시간 모니터링

1초 단위 메트릭 수집 가능

글로벌 인프라

전 세계 데이터 센터

SSO/RBAC

엔터프라이즈 보안 기능

Datadog vs 오픈소스 vs CloudWatch

spinner
항목
Datadog
CloudWatch
Prometheus+Grafana

배포 모델

SaaS

관리형

자체 호스팅

초기 설정

매우 쉬움

쉬움

중간

운영 부담

없음

낮음

높음

비용 예측성

높음 (호스트 기반)

낮음 (사용량 기반)

높음 (인프라 기반)

확장성

자동

자동

수동

APM

포함

별도 (X-Ray)

별도 구축

알림

고급

기본

Alertmanager

EKS 통합 아키텍처

전체 아키텍처

spinner

구성 요소

구성 요소
역할

Datadog Agent

노드별 메트릭, 로그, 트레이스 수집 (DaemonSet)

Cluster Agent

클러스터 레벨 메트릭 및 이벤트 수집

Admission Controller

자동 APM 계측 주입

Trace Agent

APM 트레이스 수집 및 전송

Process Agent

프로세스 및 컨테이너 메트릭

Datadog Agent 설치

Helm을 사용한 설치

values.yaml

IRSA 설정 (선택사항 - AWS 통합용)

인프라 모니터링

자동 수집 메트릭

Datadog Agent는 자동으로 다양한 인프라 메트릭을 수집합니다.

시스템 메트릭:

Kubernetes 메트릭:

커스텀 메트릭 수집

Prometheus 어노테이션 기반

DogStatsD 사용

서비스 디스커버리

APM 및 분산 트레이싱

자동 계측 설정

Admission Controller를 통한 자동 계측:

수동 계측 (Java)

수동 계측 (Python)

서비스 맵

트레이스 데이터를 기반으로 자동으로 서비스 맵이 생성됩니다:

로그 관리

자동 로그 수집

파드별 로그 설정

로그 파이프라인

Datadog UI에서 로그 파이프라인을 구성하거나 API로 설정:

트레이스-로그 연결

대시보드 및 알림

대시보드 생성 (API)

모니터(알림) 설정

Watchdog AI

Watchdog은 자동으로 이상을 감지하고 알림을 생성합니다:

비용 구조

요금제 개요

플랜
인프라
APM
로그
특징

Free

5 호스트

-

-

1일 보존

Pro

$15/호스트/월

$31/호스트/월

$0.10/GB

15개월 보존

Enterprise

$23/호스트/월

$40/호스트/월

$0.10/GB

커스텀 보존

비용 계산 예시

100 노드 EKS 클러스터:

비용 최적화 전략

spinner

1. 메트릭 최적화

2. 로그 최적화

3. APM 샘플링

모범 사례

1. 태깅 전략

2. 알림 계층화

3. SLO 설정

문제 해결

일반적인 문제

1. Agent가 메트릭을 전송하지 않음

2. APM 트레이스 누락

3. 로그 수집 안됨

디버깅 명령어

참고 자료

퀴즈

이 장에서 배운 내용을 테스트하려면 Datadog 퀴즈를 풀어보세요.

마지막 업데이트