Part 9: 운영
개요
설치 가이드
방법 1: Tigera Operator (권장)
# 1. Tigera Operator 설치
kubectl create -f https://raw.githubusercontent.com/projectcalico/calico/v3.29.0/manifests/tigera-operator.yaml
# Operator 준비 대기
kubectl wait --for=condition=available --timeout=300s deployment/tigera-operator -n tigera-operator# 2. Installation CR 적용
apiVersion: operator.tigera.io/v1
kind: Installation
metadata:
name: default
spec:
# 네트워크 설정
calicoNetwork:
bgp: Enabled
# IP Pool 설정
ipPools:
- cidr: 10.244.0.0/16
encapsulation: VXLANCrossSubnet
natOutgoing: Enabled
nodeSelector: all()
blockSize: 26
# Node IP 자동 감지
nodeAddressAutodetectionV4:
kubernetes: NodeInternalIP
# MTU 설정 (선택)
# mtu: 1400
# 컴포넌트 리소스
componentResources:
- componentName: Node
resourceRequirements:
requests:
cpu: 200m
memory: 256Mi
limits:
cpu: 1000m
memory: 512Mi
- componentName: Typha
resourceRequirements:
requests:
cpu: 100m
memory: 128Mi
limits:
cpu: 500m
memory: 256Mi
- componentName: KubeControllers
resourceRequirements:
requests:
cpu: 100m
memory: 128Mi
limits:
cpu: 500m
memory: 256Mi
# Typha 배포 설정
typhaDeployment:
spec:
minReadySeconds: 10
template:
spec:
tolerations:
- key: CriticalAddonsOnly
operator: Exists
# 노드 업데이트 전략
nodeUpdateStrategy:
rollingUpdate:
maxUnavailable: 1
type: RollingUpdate방법 2: Manifest 설치
방법 3: Helm 설치
설치 검증
calicoctl 명령어 레퍼런스
설치
노드 명령어
IPAM 명령어
Policy 명령어
리소스 명령어
Prometheus 메트릭
Felix 메트릭
메트릭
설명
타입
BIRD 메트릭
Typha 메트릭
메트릭
설명
타입
Grafana 대시보드
주요 패널 구성
Alert 규칙
PrometheusRule 설정
로그 분석
Felix 로그
메시지 패턴
의미
조치
BIRD 로그
로그 레벨 설정
트러블슈팅 상세
1. Pod가 IP를 받지 못하는 경우
2. Pod 간 통신 실패
3. Network Policy가 작동하지 않음
4. BGP 피어링 실패
헬스체크 자동화
헬스체크 스크립트
Kubernetes Job으로 실행
버전 업그레이드
Rolling Upgrade (Operator 사용)
Canary 업그레이드
롤백 절차
백업 및 재해 복구
백업 대상
항목
백업 방법
빈도
백업 스크립트
복구 절차
모범 사례
1. 보안 강화
2. 관측성 설정
3. 성능 최적화
4. 리소스 관리
다음 단계
참고 자료
퀴즈
마지막 업데이트