★ Begriff· Infrastruktur
Cold Start
Verzögerung beim ersten Request nach Idle — Container muss hochgefahren, Modell-Gewichte ins GPU-Memory geladen werden. Bei 70B-Modellen 30-90s. Mitigated durch Warm-Pools.
Verwandte Tools
Auch bekannt als
cold-start · kaltstart
Aktivität
9
Mentions in den letzten 7 Tagen
4 Wochen
⚡neu · 9×
Zuletzt erwähnt in
- AMRS: Rollout-basiertes Weltmodell für affektive Musikempfehlung ohne Online-Experimente2026-05-28
- FLUID: Livestreaming-Empfehlungen ohne Item-IDs dank multimodaler semantischer Codes2026-05-28
- VULPO: LLM-Framework erkennt Sicherheitslücken kontextbewusst per RL-Optimierung2026-05-28
- E³-Agent reduziert Inferenz-Latenz am Edge um bis zu 73 %2026-05-28
- Plan Before Search: Self-Bootstrapping für Multi-Hop-Retrieval-Agenten2026-05-28