★ Begriff· Infrastruktur
Rate Limit
Maximale Anzahl Requests/Tokens pro Zeitfenster, die ein API-Provider erlaubt. Tier-basiert (Free/Build/Scale). Wichtig für Production-Anwendungen — Backoff-Strategie + Provider-Fallback nötig.
Verwandte Tools
Auch bekannt als
rate-limit · tpm · rpm