운영 가이드 소개

마지막 업데이트: 2026년 2월 23일

이 섹션은 EKS Auto Mode 기반 프로덕션 환경의 실전 운영 가이드입니다. Terraform을 사용한 인프라 프로비저닝부터 CI/CD 파이프라인, GitOps 기반 배포, 스케일링, 관측성, 리소스 최적화, 업그레이드까지 포괄합니다.


대상 독자

  • EKS Auto Mode를 사용하여 프로덕션 환경을 구축하는 플랫폼 엔지니어

  • Terraform/Terragrunt 기반 IaC를 운영하는 인프라 엔지니어

  • GitLab CI, ArgoCD를 활용한 CI/CD 파이프라인을 구축하는 DevOps 엔지니어

  • Prometheus, Grafana, Loki 기반 관측성 스택을 운영하는 SRE


전제 조건


목차

#
문서
주요 내용

01

VPC, EKS Auto Mode, Pod Identity를 3-Layer Terraform으로 구성

02

듀얼 클러스터 아키텍처, NLB 가중치, DNS 라우팅

03

ECR, GitLab Runner, GitHub ARC, 멀티 플랫폼 빌드

04

Hub-spoke, ApplicationSet, IAM Identity Center SSO

05

Atlantis, FluxCD, Terraform Cloud, AIOps

06

HPA 커스텀 메트릭, KEDA, VPA, Spot 활용

07

네트워크/CPU/디스크/Auto Mode 노드 종료 알림

08

Logs/Metrics/Traces 상관 분석, PromQL, LogQL, TraceQL

09

Loki, Tempo, Prometheus/AMP 설치 및 운영

10

Requests/Limits, JVM 튜닝, 프레임워크별 가이드

11

Auto Mode 무중단 업그레이드, 블루/그린 전략


학습 경로

권장 순서

역할별 권장 문서

역할
필수
권장

플랫폼 엔지니어

01, 02, 04, 11

06, 07

인프라 엔지니어

01, 02, 05

09, 11

DevOps 엔지니어

03, 04, 05

06, 07

SRE

07, 08, 09

10, 11

애플리케이션 개발자

06, 10

03, 08


기존 문서와의 관계

이 운영 가이드는 기존 개념 문서를 보완하는 실전 코드 중심 가이드입니다:

카테고리
개념 이해
실전 운영 (이 가이드)

EKS

Terraform HCL, 업그레이드 스크립트

GitOps

ApplicationSet, 멀티클러스터 설정

스케일링

HPA 커스텀 메트릭, VPA 통합

관측성

PromQL, LogQL, TraceQL 쿼리

보안

Policy 운영 가이드

문서 간 연계


빠른 시작

1. 인프라 프로비저닝

2. 애플리케이션 배포

3. 모니터링 확인


지원 및 피드백

  • 이슈 리포트: GitHub Issues

  • 문서 기여: Pull Request 환영

  • 질문: Slack #kubernetes-docs 채널

마지막 업데이트