핵심 개념: AI 기반 근본 원인 분석

CloudWatch Investigations란?

CloudWatch Investigations는 AI를 활용하여 운영 문제의 근본 원인을 자동으로 분석하는 서비스입니다. 수동으로 여러 대시보드를 확인하고 로그를 검색하는 대신, AI가 관련 데이터를 수집하고 상관관계를 분석하여 근본 원인 가설을 제시합니다.

주요 구성 요소

Investigation Group

Investigation Group은 조사 범위를 정의하는 리소스 그룹입니다. 특정 AWS 리소스들을 포함하여 AI가 분석할 범위를 설정합니다.

IAM 역할

Investigation Group에서 사용하는 IAM 역할은 다음 리소스에 대한 접근 권한이 필요합니다:

  • CloudWatch Metrics

  • CloudWatch Logs

  • X-Ray Traces

  • EC2 인스턴스 정보

  • RDS 인스턴스 정보

조사 흐름

가설 (Hypothesis)

가설은 AI가 수집한 데이터를 기반으로 생성한 근본 원인 추론입니다.

구성 요소:

  • 근본 원인 요약: 무엇이 문제인지에 대한 상세 설명

  • 가설 추론: 이 가설을 도출한 지원 데이터

  • 제안된 작업: 문제 해결을 위한 구체적 단계

  • 수락/거부: 사용자가 가설을 검토하고 판단

인시던트 보고서

조사가 완료되면 자동 생성되는 보고서에 포함되는 항목:

항목
내용

인시던트 개요

심각도, 지속 시간, 가설

영향 평가

고객 및 비즈니스 영향

탐지 및 대응

탐지 방법/시기, 대응 조치

근본 원인 분석

AI가 식별한 원인

완화 및 해결

수행된 단계, 시간 측정

학습 및 다음 단계

권장 조치

마지막 업데이트