Gemma 4: 96 tok/s en tarjetas RTX dobles, solucionando mis bugs de Kubernetes antes del almuerzo
96 tokens por segundo. Gemma 4 devorando reportes de bugs de Kubernetes en mi configuración de dos RTX. El modelo abierto de Google convirtió el 'esperar y cruzar los dedos' en 'desplegar y depurar ahora mismo'.
⚡ Key Takeaways
Worth sharing?
Get the best Developer Tools stories of the week in your inbox — no noise, no spam.
Originally reported by dev.to