스노우플레이크를 도입해보면, 처음에는 “관리도 편하고 필요할 때만 컴퓨팅 쓰니까 비용이 깔끔하겠네” 하는 기대가 많아요. 그런데 막상 실제로 돌려보면 비용에서 의외로 헛손질이 생기는 부분이 꽤 있어요. 가장 많이 나오는 이슈들만 현실적으로 정리해볼게요.
가장 흔한 건 컴퓨팅을 꺼놓지 않는 문제예요. 스노우플레이크는 컴퓨팅이 돌아가는 시간만큼 비용이 쌓이는 구조라, 쿼리가 끝났는데도 웨어하우스가 계속 켜져 있으면 그 시간이 전부 비용이 돼버려요. 자동 종료 설정을 안 해두거나, 배치 작업이 실패해서 웨어하우스가 멈추지 않고 돌아가던 경우가 종종 있어요. 이런 사소한 설정 하나 차이로 월 비용이 그대로 몇 배씩 튀기도 해요.
두 번째로 많은 게 과도한 스캔량이에요. 테이블은 거대하고, 쿼리는 단순한데 전체 데이터를 통째로 읽어버리는 방식이죠. 필요한 컬럼만 뽑으면 될 걸, 습관적으로 select *로 쓰거나, 설계가 비효율적이라 스토리지를 과하게 스캔하게 되는 경우가 많아요. 스토리지 비용 자체는 싸지만, 스캔량이 커지면 결국 컴퓨팅 비용이 같이 커져요.
또 하나 자주 나오는 게 웨어하우스를 지나치게 크게 잡는 문제예요. 처음엔 “성능 좋게 하려면 큰 웨어하우스 써야지” 하고 L이나 XL 사이즈로 켜두는데, 막상 팀이 필요로 하는 건 그 절반에도 못 미치는 수준일 때가 많아요. 스노우플레이크는 크기만 줄여도 처리 속도는 크게 떨어지지 않는 경우가 많은데, 이걸 조직이 초기에 잘 몰라요.
동시성도 비용 이슈의 원인이 돼요. 여러 팀이 동시에 작업하면 충돌이 생길까 봐 웨어하우스를 여러 개 만들어두는데, 이게 겹치면 비용도 여러 배가 돼요. 실제로는 쿼리 패턴만 정리해도 웨어하우스 수를 크게 줄일 수 있는데, 그냥 팀마다 하나씩 만들어두면서 비용이 부풀어가는 경우가 흔해요.
마지막으로 스토리지 비용 자체는 저렴하지만, 오래된 데이터나 쓸모없는 로그가 계속 쌓이는 경우가 있어요. 삭제 정책을 안 정해두면 결국 분석과 무관한 데이터가 산처럼 쌓이면서 비용이 조금씩, 근데 꾸준히 올라가요. 이건 티가 잘 안 나서 나중에 한꺼번에 발견되기도 하고요.
정리해보면, 스노우플레이크 도입 후 발생하는 비용 이슈는 대부분 설정이나 사용 습관에서 생겨요. 웨어하우스를 켜놓고 잊어버리는 일, 쿼리 설계 미흡, 지나친 리소스 할당, 데이터 정리 부족 같은 것들이죠. 기술 문제라기보다 운영 방식에서 생기는 부분이 많아서, 초반 설정과 모니터링만 잘 해도 비용은 생각보다 안정적으로 잡힐 때가 많아요.