Observability 분석 방법
목차
상관 분석 전략
Trace ID 전파
W3C TraceContext 표준
B3 헤더 형식 (Zipkin 호환)
OpenTelemetry SDK 계측 패턴
Go 애플리케이션 계측
Python 애플리케이션 계측
Exemplars: 메트릭과 트레이스 연결
Log-Trace 상관관계
구조화된 로깅 (JSON)
Logback 설정 (Java/Spring)
아키텍처 다이어그램
상관 분석 워크플로우
Loki LogQL 분석
오류율 계산
지연 시간 추출
로그 기반 알림 규칙
레이블 전략과 카디널리티
LogQL 패턴 매칭 및 파싱
집계 쿼리
멀티라인 로그 처리
전체 Loki 알림 규칙 예시
Prometheus PromQL 패턴
RPS (Requests Per Second) 계산
RED 메소드 구현
Istio Service Mesh 메트릭
ALB 메트릭 (CloudWatch 연동)
AMP (Amazon Managed Prometheus) 쿼리 패턴
Recording Rules
Recording Rules YAML 전체 예시
Tempo TraceQL 분석
기본 TraceQL 구문
지연 시간 분석
오류 트레이스 검색
서비스 의존성 매핑
Span 속성 필터링
구조적 쿼리 (부모-자식 관계)
트레이스 비교 (배포 전후)
서비스 그래프 생성
TraceQL 고급 패턴
Grafana 대시보드
RED 메소드 대시보드
USE 메소드 (인프라)
크로스 데이터소스 링킹
Prometheus → Tempo (Exemplars)
Loki → Tempo (Derived Fields)
대시보드 프로비저닝
변수 템플릿
통합 관측성 대시보드 JSON
참고 자료
관련 문서
마지막 업데이트