Sapient Intelligence veröffentlicht HRM-Text 1B: 40B Tokens, ~1.000 $ Training, schlägt Llama 3.2 3B auf MATH

Warum es zählt

Das Modell zeigt, dass hierarchische Reasoning-Architekturen mit drastisch weniger Daten (bis zu 900× weniger als Llama 3.2 3B) auf Multi-Step-Reasoning-Benchmarks konkurrenzfähig sein können — allerdings liegen bisher nur selbst berichtete Zahlen vor.

— Lumeric Redaktion

HRM-Text 1B ist ein 1-Milliarden-Parameter-Modell von Sapient Intelligence, das auf 40B Tokens mit ~1.000 $ Budget trainiert wurde und auf MATH (56,2) und DROP (82,2) mehrere größere Modelle übertrifft.

Quelle lesenreddit.com

MATH · Spitzenwert

56.2%

HRM-Text 1B

Foundation Modelle Open Source Evals Benchmarks

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Sapient Intelligence veröffentlicht HRM-Text 1B: 40B Tokens, ~1.000 $ Training, schlägt Llama 3.2 3B auf MATH

ToolsGPT Qwen Llama Hugging Face

CompaniesHugging Face

Warum es zählt

— Lumeric Redaktion

MATH · Spitzenwert

56.2%

HRM-Text 1B

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Sapient Intelligence veröffentlicht HRM-Text 1B: 40B Tokens, ~1.000 $ Training, schlägt Llama 3.2 3B auf MATH

Frag die KI zum Artikel

Verwandte Beiträge

Sapient Intelligence veröffentlicht HRM-Text 1B: 40B Tokens, ~1.000 $ Training, schlägt Llama 3.2 3B auf MATH

Frag die KI zum Artikel

Verwandte Beiträge