노드 라이프사이클 관리
1. nodeadm 고급 설정 (Advanced NodeConfig)
kubelet 튜닝
리소스 예약 (system-reserved / kube-reserved)
kubelet:
config:
systemReserved:
cpu: "500m"
memory: "1Gi"
ephemeral-storage: "10Gi"
kubeReserved:
cpu: "500m"
memory: "1Gi"
ephemeral-storage: "5Gi"파라미터
설명
권장값
축출 임계값 (Eviction Thresholds)
maxPods 계산
마스크 크기
IP 수
권장 maxPods
이미지 가비지 컬렉션
셧다운 그레이스 기간
containerd 고급 설정
프라이빗 레지스트리 미러 설정
GPU 노드용 NVIDIA 런타임 클래스
레이블 및 테인트 전략
nodeadm 자동 레이블
추가 커스텀 레이블 전략
테인트 전략
전략
설명
사용 사례
전체 NodeConfig 예시 (프로덕션급)
2. 대규모 노드 설치 자동화 (Fleet Installation)
Ansible Playbook
인벤토리 구성
자동화 플레이북
롤별 변수 (GPU 노드 vs 일반 노드)
설치 검증 스크립트
3. 노드 업그레이드 전략 (Upgrade Strategies)
버전 스큐 정책
kubelet 버전
API 서버 버전
호환 여부
업그레이드 사전 체크리스트
롤링 업그레이드
카나리 업그레이드
롤백 절차
4. 자격 증명 라이프사이클 (Credential Lifecycle)
SSM Hybrid Activation 갱신
IAM Roles Anywhere 인증서 갱신
인증서 만료 모니터링
자동 갱신 스크립트
Trust Anchor 업데이트
5. 노드 헬스체크 자동화 (Health Monitoring)
자동화된 헬스체크 CronJob
kubelet/containerd 상태 모니터링 (노드 레벨)
마지막 업데이트