☁️ Cloud & Infrastructure

Cloud Run 워커 풀: AI 확장 비용 40% 절감 [Estée Lauder 사례]

연말 쇼핑객들이 Jo Malone AI 향수 추천 앱을 마구 두드려도 Estée Lauder는 꿈쩍도 안 했다. Cloud Run 워커 풀 덕분. 그런데 이 서버리스 전환이 진짜 돈 절감일까, 아니면 Google 홍보용?

Cloud Run 워커 풀 대시보드에서 Estée Lauder AI Scent Advisor 인터페이스

⚡ Key Takeaways

  • Estée Lauder, Cloud Run 워커 풀로 연말 소비자 AI 스케일링—메시지 손실 제로, 서버 관리 제로. 𝕏
  • 장기 태스크 서비스/잡보다 40% 저렴; 분산 ML용 GPU 지원. 𝕏
  • CREMA 오픈소스, Pub/Sub·Kafka 스케일링—서지 대응하고 제로 아이들. 𝕏
  • 프로듀서-컨슈머 모델로 UI와 무거운 LLM 추론 분리. 𝕏
Jordan Kim
Written by

Jordan Kim

Cloud and infrastructure correspondent. Covers Kubernetes, DevOps tooling, and platform engineering.

Worth sharing?

Get the best Developer Tools stories of the week in your inbox — no noise, no spam.

Originally reported by Google Cloud Blog

Stay in the loop

The week's most important stories from Dev Digest, delivered once a week.