AutoScaling using istio metrics
목차
개요
핵심 Istio 메트릭
메트릭
설명
스케일링 활용
왜 KEDA를 사용하는가?
기능
Kubernetes HPA
KEDA
주요 스케일링 전략
전략
주 메트릭
적합한 시나리오
핵심 장점
아키텍처
메트릭 기반 스케일링 흐름
ScaledObject 기본 구조
Prometheus 메트릭 기반 스케일링
1. RPS (Requests Per Second) 기반 스케일링
ScaledObject 정의
동작 방식
2. Latency (지연 시간) 기반 스케일링
P95 지연 시간으로 스케일링
P50 및 P99 조합 스케일링
3. 성공률 기반 스케일링
4. 복합 메트릭 스케일링
CloudWatch 메트릭 기반 스케일링
개요
CloudWatch 메트릭으로 스케일링
RPS 기반 스케일링
Latency 기반 스케일링
실전 스케일링 전략
전략 1: 트래픽 패턴 기반 예측 스케일링
전략 2: Circuit Breaker 상태 기반 스케일링
전략 3: 다단계 스케일링 (Tiered Scaling)
전략 4: 비용 최적화 스케일링
전략 5: Gateway 메트릭 기반 스케일링
모범 사례
1. 메트릭 선택 가이드
워크로드 유형
주 메트릭
보조 메트릭
이유
2. 임계값 설정 가이드
3. 스케일링 속도 조정
4. 멀티 클러스터 환경에서의 스케일링
모범 사례
1. 메트릭 수집 최적화
2. 스케일링 안정성 확보
3. 모니터링 및 알림
4. 리소스 제한 설정
문제 해결
1. KEDA가 메트릭을 가져오지 못함
2. 스케일링이 너무 느림
3. Flapping (불안정한 스케일링)
4. CloudWatch 지연 시간
실전 예제
예제 1: 이커머스 결제 서비스
예제 2: 데이터 처리 서비스
예제 3: 멀티 리전 글로벌 서비스
참고: KEDA 설치
Helm으로 설치
AWS IRSA 설정 (CloudWatch 사용 시)
CloudWatch 메트릭 전송 설정 (선택 사항)
1단계: ADOT Collector 설치
2단계: IRSA 설정
참고 자료
공식 문서
관련 문서
요약
메트릭 소스 선택 가이드
메트릭 소스
장점
단점
권장 사용
스케일링 전략 선택 가이드
워크로드 유형
주 메트릭
보조 메트릭
권장 설정
프로덕션 체크리스트
권장 시작 경로
마지막 업데이트