SupraLabs veröffentlicht Supra-50M-Reasoning – 50M-Parameter-Modell mit Chain-of-Thought
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com3w
SupraLabs veröffentlicht Supra-50M: Kompaktes 50M-Modell schlägt GPT-2 auf mehreren Benchmarks
- FORSCHUNGarxiv.org1w
Speculative Thinking: Kleine Modelle mit LLM-Guidance ohne Training verbessern
- BENCHMARKreddit.com3w
Sapient Intelligence veröffentlicht HRM-Text 1B: 40B Tokens, ~1.000 $ Training, schlägt Llama 3.2 3B auf MATH
- FORSCHUNGarxiv.org4d
RASFT: Policy-adaptives Fine-Tuning verbessert mathematisches Reasoning
SupraLabs veröffentlicht Supra-50M-Reasoning – 50M-Parameter-Modell mit Chain-of-Thought
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com3w
SupraLabs veröffentlicht Supra-50M: Kompaktes 50M-Modell schlägt GPT-2 auf mehreren Benchmarks
- FORSCHUNGarxiv.org1w
Speculative Thinking: Kleine Modelle mit LLM-Guidance ohne Training verbessern
- BENCHMARKreddit.com3w
Sapient Intelligence veröffentlicht HRM-Text 1B: 40B Tokens, ~1.000 $ Training, schlägt Llama 3.2 3B auf MATH
- FORSCHUNGarxiv.org4d
RASFT: Policy-adaptives Fine-Tuning verbessert mathematisches Reasoning