SupraLabs veröffentlicht Supra-Router-51M: Winziges Prompt-Routing-Modell
ToolsHugging Face
CompaniesHugging Face
Warum es zählt
Mit nur 51M Parametern lässt sich das Routing-Modell latenzarm in bestehende Inference-Pipelines einbetten, um Kosten durch intelligentes Modell-Routing zu senken – ohne manuell Schwellenwerte definieren zu müssen.
— Lumeric Redaktion
51M Parameter
Modellgröße des Prompt-Routers
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com3w
SupraLabs veröffentlicht Supra-1.5-50M: 5× mehr Kontext für kleines Sprachmodell
- LAUNCHgithub.com1w
Wayfinder Router: deterministisches LLM-Routing ohne Modell-Call
- FORSCHUNGarxiv.org3w
ARMS: 800M-Router wählt optimales Vision-Language-Modell aus
- FORSCHUNGarxiv.org3w
TimeRouter: Effizientes Routing für Time-Series Foundation Models ohne LLM
SupraLabs veröffentlicht Supra-Router-51M: Winziges Prompt-Routing-Modell
ToolsHugging Face
CompaniesHugging Face
Warum es zählt
Mit nur 51M Parametern lässt sich das Routing-Modell latenzarm in bestehende Inference-Pipelines einbetten, um Kosten durch intelligentes Modell-Routing zu senken – ohne manuell Schwellenwerte definieren zu müssen.
— Lumeric Redaktion
51M Parameter
Modellgröße des Prompt-Routers
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com3w
SupraLabs veröffentlicht Supra-1.5-50M: 5× mehr Kontext für kleines Sprachmodell
- LAUNCHgithub.com1w
Wayfinder Router: deterministisches LLM-Routing ohne Modell-Call
- FORSCHUNGarxiv.org3w
ARMS: 800M-Router wählt optimales Vision-Language-Modell aus
- FORSCHUNGarxiv.org3w
TimeRouter: Effizientes Routing für Time-Series Foundation Models ohne LLM