★ Begriff· Infrastruktur
Serverless GPU
GPU-Compute, das pro-Request-skaliert (statt 24/7 reserviert). Modal, Replicate, Banana. Cold-Start ein Problem (5-30s), aber Cost-Effizienz hoch bei sporadischen Workloads.
Verwandte Tools
Auch bekannt als
serverless inference