워크샵 개요

배경: 새벽 3시 알림

"새벽 3시, 알림 메시지가 전화기를 울립니다. 반쯤 잠든 상태로 노트북 앞에 앉아 무한히 로그를 스크롤하며 흔한 문제인지, 새로운 문제인지 파악하려 합니다. 며칠 전 비슷한 문제를 해결했던 것 같은데 수정 사항이 뭐였더라? 동료가 비슷한 걸 봤을 수도 있는데 새벽 3시에 확인하기엔 너무 이른 시간입니다..."

이것은 전 세계 조직에서 흔히 발생하는 시나리오입니다. 숙련된 클라우드 운영자들이 여러 대시보드에서 운영 데이터를 상관분석하는 데 상당한 시간을 투자합니다.

AI 에이전트가 클라우드 운영 파트너가 된다면?

자동화된 인텔리전스가 알림 대응을 처리하는 미래를 상상해보세요. 에이전트가 다음을 수행할 수 있다면:

  • AgentCore Runtime으로 고급 추론 능력을 가진 LLM이 문제 해결 절차를 수행

  • CloudWatch Investigations로 인시던트 대응을 돕는 AI 어시스턴트

  • AgentCore Memory로 네트워크 환경과 과거 상호작용에 대한 맥락적 이해

  • A2A 통신으로 도메인 전문 에이전트 간 원활한 협업

이것은 이론적인 제안이 아닙니다 -- 오늘 여러분이 구현할 AI 기반 클라우드 운영의 현실입니다.

워크샵 목표

  • 지능형 자동화: AI 에이전트가 네트워크 문제를 자율적으로 진단하고 수정

  • MTTR 단축: CloudWatch Investigations로 근본 원인 분석 시간 대폭 단축

  • 컨텍스트 유지: 세션 간 대화 및 지식 유지로 연속성 있는 문제 해결

  • 멀티 에이전트 협업: A2A 프로토콜을 통한 전문 에이전트 간 협업

예상 소요 시간

모듈
주제
소요 시간

모듈 1

AgentCore Runtime

~30분

모듈 2

CloudWatch Investigations

~20분

모듈 3 [선택]

AgentCore Memory

~20분

모듈 4 [선택]

A2A 프로토콜

~30분

합계

~2시간

워크샵 시나리오

이 워크샵은 가상의 ExampleCorp 회사의 이미징 플랫폼을 기반으로 진행됩니다. 시뮬레이션되는 문제들은 다음과 같습니다:

문제 유형
시뮬레이션 방법
에이전트 해결 방식

연결성 문제

보안 그룹 규칙 제거

VPC Reachability Analyzer로 진단 → 보안 그룹 수정

성능 문제

트래픽 생성으로 TCP 재전송 유발

Network Flow Monitor로 감지 → Traffic Mirroring 분석

CloudWatch 경보

IAM 정책 거부 주입

AI 기반 Investigation으로 근본 원인 분석

마지막 업데이트