CloudWatch Investigations는 AI를 활용하여 운영 문제의 근본 원인을 자동으로 분석하는 서비스입니다. 수동으로 여러 대시보드를 확인하고 로그를 검색하는 대신, AI가 관련 데이터를 수집하고 상관관계를 분석하여 근본 원인 가설을 제시합니다.
Investigation Group은 조사 범위를 정의하는 리소스 그룹입니다. 특정 AWS 리소스들을 포함하여 AI가 분석할 범위를 설정합니다.
Investigation Group에서 사용하는 IAM 역할은 다음 리소스에 대한 접근 권한이 필요합니다:
CloudWatch Metrics
CloudWatch Logs
X-Ray Traces
EC2 인스턴스 정보
RDS 인스턴스 정보
가설은 AI가 수집한 데이터를 기반으로 생성한 근본 원인 추론입니다.
구성 요소:
근본 원인 요약: 무엇이 문제인지에 대한 상세 설명
가설 추론: 이 가설을 도출한 지원 데이터
제안된 작업: 문제 해결을 위한 구체적 단계
수락/거부: 사용자가 가설을 검토하고 판단
조사가 완료되면 자동 생성되는 보고서에 포함되는 항목:
인시던트 개요
심각도, 지속 시간, 가설
영향 평가
고객 및 비즈니스 영향
탐지 및 대응
탐지 방법/시기, 대응 조치
근본 원인 분석
AI가 식별한 원인
완화 및 해결
수행된 단계, 시간 측정
학습 및 다음 단계
권장 조치
마지막 업데이트 1개월 전