LLM Planner: Hardware-Ratgeber für 60+ Builds und 50+ Modelle
Der Reddit-Nutzer /u/totosse17 hat llmrequirements.com als persönliches Projekt gestartet, nachdem er selbst vor der Wahl zwischen einer RTX 5090, einem Nvidia DGX Spark und einem Asus Strix Halo stand – und schließlich beim Spark von Asus landete. Die Plattform funktioniert in zwei Richtungen: Entweder gibt der Nutzer Use-Case, Wunschmodell und Budget an und bekommt passende Hardware-Builds empfohlen, oder er gibt seine vorhandene Hardware (z. B. RTX 3090, M3 Max, Radeon RX 9700) ein und sieht, welche Open-Weights-Modelle darauf gut laufen. Über 60 spezifische Build-Konfigurationen sind enthalten, darunter Consumer-, Workstation- und Datacenter-Hardware mit An/Aus-Filter. Für jedes Modell werden Decode- und Prompt-Processing-Tokens/s bei den Quantisierungsstufen Q2, Q4, Q5 und Q8 ausgewiesen, dazu die Zeit bis zum ersten Token bei 100.000-Token-Prompts sowie Idle- und Last-Wattverbrauch. Preise werden als Neu- und Gebrauchtpreise in mehreren Regionen angezeigt. Als Decken-Referenz zeigt der Reverse-Modus die vier geschlossenen Frontier-Modelle Gemini 2.5 Pro, GPT-5.5, Claude Sonnet 4.6 und Claude Opus 4.7. Alle Daten liegen in einem öffentlichen GitHub-Repository und werden mindestens wöchentlich aktualisiert.
- 60+ Build-Konfigurationen inkl. Consumer-, Workstation- und Datacenter-Hardware mit Plug-and-Play-Filter
- Tokens/s für Decode und Prompt-Processing bei Q2/Q4/Q5/Q8 je Modell, 130+ zitierte Quellen
- 150+ verlinkte YouTube-Reviews zu den einzelnen Hardware-Builds
- Reverse-Modus: Hardware eingeben → passende Open-Weights-Modelle für Chat, Coding, Agents, Reasoning ranken
- Daten öffentlich auf GitHub (Trenin-Labs/LlmRequirements), wöchentliche Updates, Community kann Benchmarks einreichen
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
LLM Planner: Hardware-Ratgeber für 60+ Builds und 50+ Modelle
Der Reddit-Nutzer /u/totosse17 hat llmrequirements.com als persönliches Projekt gestartet, nachdem er selbst vor der Wahl zwischen einer RTX 5090, einem Nvidia DGX Spark und einem Asus Strix Halo stand – und schließlich beim Spark von Asus landete. Die Plattform funktioniert in zwei Richtungen: Entweder gibt der Nutzer Use-Case, Wunschmodell und Budget an und bekommt passende Hardware-Builds empfohlen, oder er gibt seine vorhandene Hardware (z. B. RTX 3090, M3 Max, Radeon RX 9700) ein und sieht, welche Open-Weights-Modelle darauf gut laufen. Über 60 spezifische Build-Konfigurationen sind enthalten, darunter Consumer-, Workstation- und Datacenter-Hardware mit An/Aus-Filter. Für jedes Modell werden Decode- und Prompt-Processing-Tokens/s bei den Quantisierungsstufen Q2, Q4, Q5 und Q8 ausgewiesen, dazu die Zeit bis zum ersten Token bei 100.000-Token-Prompts sowie Idle- und Last-Wattverbrauch. Preise werden als Neu- und Gebrauchtpreise in mehreren Regionen angezeigt. Als Decken-Referenz zeigt der Reverse-Modus die vier geschlossenen Frontier-Modelle Gemini 2.5 Pro, GPT-5.5, Claude Sonnet 4.6 und Claude Opus 4.7. Alle Daten liegen in einem öffentlichen GitHub-Repository und werden mindestens wöchentlich aktualisiert.
- 60+ Build-Konfigurationen inkl. Consumer-, Workstation- und Datacenter-Hardware mit Plug-and-Play-Filter
- Tokens/s für Decode und Prompt-Processing bei Q2/Q4/Q5/Q8 je Modell, 130+ zitierte Quellen
- 150+ verlinkte YouTube-Reviews zu den einzelnen Hardware-Builds
- Reverse-Modus: Hardware eingeben → passende Open-Weights-Modelle für Chat, Coding, Agents, Reasoning ranken
- Daten öffentlich auf GitHub (Trenin-Labs/LlmRequirements), wöchentliche Updates, Community kann Benchmarks einreichen
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.