LLM Planner: Hardware-Ratgeber für 60+ Builds und 50+ Modelle

ToolsClaude GPT Gemini NVIDIA Hardware Llama

Warum es zählt

Das Tool nimmt lokalen LLM-Nutzern die Recherche ab: 130+ zitierte Quellen, Tokens/s für Q2 bis Q8, Idle- und Lastverbrauch sowie 150+ verlinkte YouTube-Reviews erlauben fundierte Kaufentscheidungen ohne zusätzliche Google-Suche.

— Lumeric Redaktion

Der Reddit-Nutzer /u/totosse17 hat llmrequirements.com als persönliches Projekt gestartet, nachdem er selbst vor der Wahl zwischen einer RTX 5090, einem Nvidia DGX Spark und einem Asus Strix Halo stand – und schließlich beim Spark von Asus landete. Die Plattform funktioniert in zwei Richtungen: Entweder gibt der Nutzer Use-Case, Wunschmodell und Budget an und bekommt passende Hardware-Builds empfohlen, oder er gibt seine vorhandene Hardware (z. B. RTX 3090, M3 Max, Radeon RX 9700) ein und sieht, welche Open-Weights-Modelle darauf gut laufen. Über 60 spezifische Build-Konfigurationen sind enthalten, darunter Consumer-, Workstation- und Datacenter-Hardware mit An/Aus-Filter. Für jedes Modell werden Decode- und Prompt-Processing-Tokens/s bei den Quantisierungsstufen Q2, Q4, Q5 und Q8 ausgewiesen, dazu die Zeit bis zum ersten Token bei 100.000-Token-Prompts sowie Idle- und Last-Wattverbrauch. Preise werden als Neu- und Gebrauchtpreise in mehreren Regionen angezeigt. Als Decken-Referenz zeigt der Reverse-Modus die vier geschlossenen Frontier-Modelle Gemini 2.5 Pro, GPT-5.5, Claude Sonnet 4.6 und Claude Opus 4.7. Alle Daten liegen in einem öffentlichen GitHub-Repository und werden mindestens wöchentlich aktualisiert.

Was wir noch wissen

60+ Build-Konfigurationen inkl. Consumer-, Workstation- und Datacenter-Hardware mit Plug-and-Play-Filter
Tokens/s für Decode und Prompt-Processing bei Q2/Q4/Q5/Q8 je Modell, 130+ zitierte Quellen
150+ verlinkte YouTube-Reviews zu den einzelnen Hardware-Builds
Reverse-Modus: Hardware eingeben → passende Open-Weights-Modelle für Chat, Coding, Agents, Reasoning ranken
Daten öffentlich auf GitHub (Trenin-Labs/LlmRequirements), wöchentliche Updates, Community kann Benchmarks einreichen

Quelle lesenreddit.com

Inferenz Infra Open Source Developer Tooling

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

LLM Planner: Hardware-Ratgeber für 60+ Builds und 50+ Modelle

ToolsClaude GPT Gemini NVIDIA Hardware Llama

CompaniesNVIDIA Google DeepMind

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

60+ Build-Konfigurationen inkl. Consumer-, Workstation- und Datacenter-Hardware mit Plug-and-Play-Filter
Tokens/s für Decode und Prompt-Processing bei Q2/Q4/Q5/Q8 je Modell, 130+ zitierte Quellen
150+ verlinkte YouTube-Reviews zu den einzelnen Hardware-Builds
Reverse-Modus: Hardware eingeben → passende Open-Weights-Modelle für Chat, Coding, Agents, Reasoning ranken
Daten öffentlich auf GitHub (Trenin-Labs/LlmRequirements), wöchentliche Updates, Community kann Benchmarks einreichen

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

LLM Planner: Hardware-Ratgeber für 60+ Builds und 50+ Modelle

Frag die KI zum Artikel

Verwandte Beiträge

LLM Planner: Hardware-Ratgeber für 60+ Builds und 50+ Modelle

Frag die KI zum Artikel

Verwandte Beiträge