Sapient Intelligence veröffentlicht HRM-Text 1B: 40B Tokens, ~1.000 $ Training, schlägt Llama 3.2 3B auf MATH
HRM-Text 1B ist ein 1-Milliarden-Parameter-Modell von Sapient Intelligence, das auf 40B Tokens mit ~1.000 $ Budget trainiert wurde und auf MATH (56,2) und DROP (82,2) mehrere größere Modelle übertrifft.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- GERÜCHTreddit.com1w
HRM-Text-1B: Neues 1B-Modell von Sapient Inc mit SOTA-Benchmarks
- FORSCHUNGhuggingface.co1w
HRM-Text: Hierarchisches Rekurrenzmodell schlägt Transformer bei Effizienz
- LAUNCHreddit.com6d
SupraLabs veröffentlicht Supra-50M: Kompaktes 50M-Modell schlägt GPT-2 auf mehreren Benchmarks
- FORSCHUNGarxiv.org3w
Qwen-Coder-2.5 (14B) schlägt 400B+-Modelle bei Text2SQL dank RLVR-Training
Sapient Intelligence veröffentlicht HRM-Text 1B: 40B Tokens, ~1.000 $ Training, schlägt Llama 3.2 3B auf MATH
HRM-Text 1B ist ein 1-Milliarden-Parameter-Modell von Sapient Intelligence, das auf 40B Tokens mit ~1.000 $ Budget trainiert wurde und auf MATH (56,2) und DROP (82,2) mehrere größere Modelle übertrifft.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- GERÜCHTreddit.com1w
HRM-Text-1B: Neues 1B-Modell von Sapient Inc mit SOTA-Benchmarks
- FORSCHUNGhuggingface.co1w
HRM-Text: Hierarchisches Rekurrenzmodell schlägt Transformer bei Effizienz
- LAUNCHreddit.com6d
SupraLabs veröffentlicht Supra-50M: Kompaktes 50M-Modell schlägt GPT-2 auf mehreren Benchmarks
- FORSCHUNGarxiv.org3w
Qwen-Coder-2.5 (14B) schlägt 400B+-Modelle bei Text2SQL dank RLVR-Training