☁️ Cloud & Infrastructure

Пулы рабочих Cloud Run: на 40% дешевле для масштабирования ИИ [кейс Estée Lauder]

Покупатели заваливают ИИ-советника Jo Malone по ароматам на праздниках? Estée Lauder даже не моргнула — спасибо пулам рабочих Cloud Run. Но правда ли этот serverless сдвиг экономит реальные деньги, или это просто пиар Google?

Интерфейс ИИ-советника ароматов Estée Lauder на дашборде пулов рабочих Cloud Run

⚡ Key Takeaways

  • Estée Lauder масштабировала потребительский ИИ на праздники с пулами рабочих Cloud Run — без потерь сообщений, без опс серверов. 𝕏
  • На 40% дешевле сервисов/джобов для долгих задач; тянет GPU для распределённого ML. 𝕏
  • CREMA открывает скейлинг для Pub/Sub, Kafka — справляется с пиками, простаивает до нуля. 𝕏
  • Модель producer-consumer отрывает UI от тяжёлого инференса LLM. 𝕏
Jordan Kim
Written by

Jordan Kim

Cloud and infrastructure correspondent. Covers Kubernetes, DevOps tooling, and platform engineering.

Worth sharing?

Get the best Developer Tools stories of the week in your inbox — no noise, no spam.

Originally reported by Google Cloud Blog

Stay in the loop

The week's most important stories from Dev Digest, delivered once a week.