wird geladen
VIA-SD: Mehrstufiges Speculative Decoding reduziert LLM-Inferenzkosten um 10–20 % · Lumeric