AWS EC2 인프라 철수기 - 3. 회고 및 배운 점

2 분 소요


이전 글에서 AWS EC2 철수를 위한 대안을 검토하고, 최종 결정을 내리는 과정을 다뤘다. 이 글에서는 전체 의사결정 과정을 돌아보며 배운 점을 정리한다.


의사결정 과정 돌아보기

초기 검토 문서를 다시 찾아보았다. 당시 CPU/GPU 노드 구성을 검토한 흔적이 있었지만, 실제 결정 근거는 남아 있지 않았다. 인스턴스 타입 변경 이력도 마찬가지였다.

초기에는 빠른 실행이 우선이었다. 비즈니스 방향이 여러 번 바뀌는 과정에서 인프라 재점검 타이밍을 놓쳤고, 리셀러를 통해 사용하다 보니 비용 가시성도 낮았다. 결과적으로, 현재 단계에 맞지 않는 비용을 지속적으로 지불해 왔다.


배운 점

1. 인프라 구축 의사결정이 너무 중요하다

인프라 결정은 한번 내리면 쉽게 바꾸기 어렵다. 특히 클라우드는 시간이 지날수록 비용이 누적되기 때문에, 초기 결정이 더욱 중요하다.

앞으로 인프라 결정 시 반드시 해야 할 것을 정립하고자 한다.

  • 워크로드 특성 분석: 클라우드가 정말 필요한가?
  • 비용 예측: 월별/연별 비용을 구체적으로 산정
  • 대안 비교: 온프레미스, 타 클라우드 등 대안과 비교
  • 결정 근거 문서화: 왜 이 선택을 했는지 기록


2. 모니터링과 관측 가능성의 중요성

이번 분석에서 가장 아쉬웠던 것은 CPU/메모리 사용량 데이터가 없다는 것이다.

실제 사용률 데이터가 있었다면:

  • Right-sizing을 훨씬 정확하게 할 수 있었다
  • 16 vCPU 중 실제로 몇 %를 사용했는지 알 수 있었다
  • 의사결정에 명확한 근거를 제시할 수 있었다

CloudWatch로 CPU/메모리 사용률을 볼 수 있었는데, 확인하지 않았다. 도구가 없어서가 아니라 보는 습관이 없었던 것이 문제였다.


3. 클라우드가 능사는 아니다

클라우드를 떠나는 것이 트렌드에서 후퇴하는 것 아닌가? 처음에는 그런 생각이 들기도 했다. 하지만 그렇지 않다.

Right-sizing infrastructure to business stage.

이번 경험을 통해 느낀 것은, 비즈니스 단계에 맞는 인프라를 선택하는 것이 중요하다는 점이다. 적어도 우리 케이스에서는, 클라우드의 핵심 가치(탄력성, 글로벌 확장성)를 활용하지 못하면서 비용만 지불하고 있었다. 그렇다면 굳이 클라우드에 남아 있을 이유가 없었다.


4. 클라우드 네이티브 사고방식은 유지하자

클라우드를 떠나더라도, 클라우드 네이티브 사고방식은 여전히 유효하다.

  • Infrastructure as Code: Terraform 등으로 인프라 코드화
  • 컨테이너 기반 배포: 쿠버네티스 유지
  • 자동화된 CI/CD: 배포 파이프라인 자동화
  • 관측 가능성: 모니터링, 로깅, 트레이싱

이런 원칙들은 온프레미스에서도 동일하게 적용된다. 인프라가 어디에 있느냐보다, 어떻게 운영하느냐가 더 중요하다.


후속 조치

당장 해야 할 것

  1. Frontend 이전: AWS 노드에서 사내망 외부 접근 가능 서버로 이동
  2. S3 버킷 구성: Model Repository용 버킷 생성 및 설정
  3. 데이터 마이그레이션: 필요한 데이터만 선별하여 S3로 이전
  4. 애플리케이션 설정 변경: Triton 등 Model Repository 접근 주소 변경


AWS 리소스 정리

마이그레이션 완료 후:

  • EC2 인스턴스 종료 및 삭제
  • EBS 볼륨 삭제 (필요한 데이터 백업 후)
  • Elastic IP 해제
  • Site-to-Site VPN 연결 해제
  • 리셀러 계약 검토


S3 도입 시 고려사항

비용 최적화:

  • S3 Intelligent-Tiering: 접근 패턴에 따라 자동 최적화
  • 태깅 전략: 리소스별 태그로 비용 추적
  • 예산 알림 설정: 예상치 못한 비용 증가 방지

보안:

  • IAM 정책 최소 권한 원칙
  • 버킷 정책 설정
  • 접근 로깅 활성화

현재 데이터 규모는 작지만, 향후 확장을 대비해 처음부터 좋은 관행을 적용해 두는 것이 좋다.


마무리

이번 경험은 많은 것을 가르쳐 주었다. 비즈니스 탐색 단계에서는 빠른 실행이 중요하지만, 어느 시점에서는 인프라 비용도, 의사결정 근거도, 모니터링도 점검해야 한다는 것을 배웠다.

초기에 클라우드를 선택한 것 자체가 잘못은 아니었다. 당시 비즈니스 방향에는 맞는 선택이었다. 다만, 비즈니스 방향이 바뀌었을 때 인프라도 함께 재점검했어야 했다. 늦게라도 문제를 인식하고 개선한 것에 의미를 두고 싶다.

앞으로는 인프라 결정에 더 신중해지고, 모니터링을 게을리하지 않고, 비용과 효용의 균형을 지속적으로 점검할 것이다.




hit count

댓글남기기