EKS 스토리지 퀴즈 - Part 3
이 퀴즈는 Amazon EKS 스토리지의 모니터링, 문제 해결, 비용 최적화 및 보안에 대한 이해도를 테스트합니다.
문제 1: 스토리지 모니터링 메트릭
EKS에서 스토리지 성능을 모니터링하기 위한 주요 메트릭은 무엇인가요?
답변: EBS 메트릭:
VolumeReadOps/VolumeWriteOps: IOPS 사용량
VolumeReadBytes/VolumeWriteBytes: 처리량
VolumeTotalReadTime/VolumeTotalWriteTime: 지연 시간
VolumeQueueLength: 대기 중인 I/O 요청 수
BurstBalance: 버스트 크레딧 잔액
EFS 메트릭:
DataReadIOBytes/DataWriteIOBytes: 데이터 전송량
MetadataIOBytes: 메타데이터 작업량
ClientConnections: 클라이언트 연결 수
PercentIOLimit: I/O 제한 사용률
Kubernetes 메트릭:
kubelet_volume_stats_used_bytes: 볼륨 사용량
kubelet_volume_stats_capacity_bytes: 볼륨 용량
container_fs_usage_bytes: 컨테이너 파일시스템 사용량
문제 2: 스토리지 문제 진단
EKS에서 포드가 "Pending" 상태에서 PVC를 마운트하지 못할 때 확인해야 할 사항은?
답변:
PVC 상태 확인:
kubectl get pvc kubectl describe pvc <pvc-name>스토리지 클래스 확인:
kubectl get storageclass kubectl describe storageclass <storage-class-name>CSI 드라이버 상태 확인:
kubectl get pods -n kube-system -l app=ebs-csi-controller kubectl logs -n kube-system -l app=ebs-csi-controller노드 권한 확인:
EC2 인스턴스 프로필에 필요한 IAM 권한 확인
EBS CSI 드라이버 서비스 계정 권한 확인
가용 영역 호환성:
포드와 EBS 볼륨이 같은 AZ에 있는지 확인
리소스 제한:
EBS 볼륨 제한 (인스턴스당 최대 볼륨 수)
볼륨 크기 제한 확인
문제 3: 성능 최적화
EKS에서 데이터베이스 워크로드의 스토리지 성능을 최적화하는 방법은?
답변:
적절한 볼륨 유형 선택:
apiVersion: storage.k8s.io/v1 kind: StorageClass metadata: name: fast-ssd provisioner: ebs.csi.aws.com parameters: type: io2 iops: "10000" encrypted: "true" volumeBindingMode: WaitForFirstConsumerMulti-Attach 볼륨 사용 (읽기 전용 워크로드):
parameters: type: io2 multiAttach: "true"인스턴스 스토어 활용:
# 임시 데이터용 인스턴스 스토어 volumeMounts: - name: instance-store mountPath: /tmp volumes: - name: instance-store hostPath: path: /mnt/instance-store적절한 파일시스템 선택:
XFS: 대용량 파일 및 높은 동시성
ext4: 일반적인 용도
적절한 마운트 옵션 설정
I/O 스케줄러 최적화:
# SSD용 noop 또는 deadline 스케줄러 echo noop > /sys/block/nvme0n1/queue/scheduler
문제 4: 비용 최적화 전략
EKS 스토리지 비용을 최적화하는 전략은?
답변:
적절한 볼륨 유형 선택:
gp3: 대부분의 워크로드에 비용 효율적
gp2에서 gp3로 마이그레이션
필요시에만 프로비저닝된 IOPS 사용
볼륨 크기 최적화:
수명 주기 관리:
EFS 스토리지 클래스 활용:
사용하지 않는 볼륨 정리:
문제 5: 보안 모범 사례
6. Amazon EKS에서 스토리지 모니터링 및 관리를 위한 가장 효과적인 도구 조합은 무엇인가요?
A. CloudWatch와 AWS Console만 사용 B. CloudWatch, Prometheus, Grafana 및 자동화된 관리 도구 C. 수동 검사 및 로그 분석 D. 타사 모니터링 도구만 사용
정답 및 설명
정답: B. CloudWatch, Prometheus, Grafana 및 자동화된 관리 도구
설명: Amazon EKS에서 스토리지 모니터링 및 관리를 위한 가장 효과적인 도구 조합은 CloudWatch, Prometheus, Grafana 및 자동화된 관리 도구를 함께 사용하는 것입니다. 이 통합 접근 방식은 AWS 네이티브 메트릭과 Kubernetes 수준의 상세 메트릭을 모두 수집하고, 시각화하며, 자동화된 관리를 통해 운영 효율성을 높입니다.
통합 모니터링 및 관리 아키텍처:
CloudWatch:
AWS 인프라 수준 메트릭 수집
EBS, EFS, FSx 스토리지 성능 메트릭
알람 및 이벤트 관리
Prometheus:
Kubernetes 수준의 상세 메트릭 수집
사용자 정의 스토리지 메트릭 수집
장기 데이터 보존 및 쿼리
Grafana:
통합 대시보드 및 시각화
CloudWatch 및 Prometheus 데이터 소스 통합
커스텀 알림 및 보고서
자동화된 관리 도구:
스토리지 프로비저닝 자동화
용량 계획 및 확장
문제 감지 및 해결
점수 계산:
5-6개 정답: 우수 (EKS 스토리지 전문가 수준)
3-4개 정답: 양호 (추가 학습 권장)
1-2개 정답: 보통 (기본 개념 복습 필요)
0개 정답: 미흡 (전체 내용 재학습 필요)
알람 및 이벤트 관리
Prometheus:
Kubernetes 수준의 상세 메트릭 수집
사용자 정의 스토리지 메트릭 수집
장기 데이터 보존 및 쿼리
Grafana:
통합 대시보드 및 시각화
CloudWatch 및 Prometheus 데이터 소스 통합
커스텀 알림 및 보고서
자동화된 관리 도구:
스토리지 프로비저닝 자동화
용량 계획 및 확장
문제 감지 및 해결
구현 예시:
CloudWatch Container Insights 설정:
Prometheus 및 스토리지 익스포터 설정:
Grafana 대시보드 구성:
자동화된 스토리지 관리 CronJob:
주요 모니터링 메트릭:
EBS 볼륨 메트릭:
VolumeReadOps/VolumeWriteOps
VolumeReadBytes/VolumeWriteBytes
VolumeQueueLength
BurstBalance (gp2 볼륨)
EFS 메트릭:
TotalIOBytes
DataReadIOBytes/DataWriteIOBytes
MetadataIOBytes
ClientConnections
StorageBytes (표준/IA)
FSx for Lustre 메트릭:
DataReadBytes/DataWriteBytes
DataReadOperations/DataWriteOperations
FreeDataStorageCapacity
LogicalDiskUsage
Kubernetes 스토리지 메트릭:
PVC 사용량 및 용량
볼륨 마운트 상태
스토리지 클래스 사용량
고급 모니터링 및 관리 기능:
예측 분석:
용량 예측 및 계획
성능 추세 분석
비용 예측
이상 탐지:
비정상적인 I/O 패턴 감지
성능 저하 조기 경고
용량 부족 예측
자동화된 최적화:
사용 패턴에 따른 볼륨 유형 추천
자동 확장 및 축소
비용 최적화 권장 사항
통합 보고:
스토리지 사용량 및 성능 보고서
비용 할당 및 분석
규정 준수 및 감사 보고서
구현 모범 사례:
다중 수준 모니터링:
인프라 수준 (CloudWatch)
Kubernetes 수준 (Prometheus)
애플리케이션 수준 (커스텀 메트릭)
알림 전략:
중요도 기반 알림 설정
알림 그룹화 및 중복 제거
에스컬레이션 경로 정의
데이터 보존 정책:
고해상도 데이터: 단기 보존
집계된 데이터: 장기 보존
비용과 유용성 균형
자동화 단계적 도입:
모니터링 및 알림 먼저 구현
보고 및 분석 기능 추가
자동화된 관리 점진적 도입
다른 옵션들의 문제점:
A. CloudWatch와 AWS Console만 사용: AWS 네이티브 메트릭은 제공하지만, Kubernetes 수준의 상세 메트릭이 부족하며 자동화 기능이 제한적입니다.
C. 수동 검사 및 로그 분석: 확장성이 떨어지고, 실시간 모니터링이 어려우며, 선제적 문제 감지가 불가능합니다.
D. 타사 모니터링 도구만 사용: AWS 네이티브 메트릭과의 통합이 제한적일 수 있으며, 추가 비용이 발생할 수 있습니다.
마지막 업데이트