Solidity LM: Qwen3.6-27B-Finetuning schlägt Claude Opus 4 auf SolEval

Warum es zählt

Ein spezialisiertes 27B-Finetuning kann laut post@1 auf SolEval ein Frontier-Modell wie Claude Opus 4 für Solidity-Codegenerierung schlagen — relevant für Web3-Entwickler, die lokale, kostengünstige Smart-Contract-Assistenz suchen.

— Lumeric Redaktion

Der Reddit-Nutzer /u/swingbear hat ein Wochenendprojekt veröffentlicht, das etwas länger als geplant dauerte: ein Finetuning von Qwen3.6-27B auf Solidity, der Programmiersprache für Ethereum-Smart-Contracts. Das daraus resultierende Modell „Qwen3.6-Solidity-27B" ist auf HuggingFace unter dem Account samscrack verfügbar. Als Vergleichsmaßstab dient SolEval, ein aufgabenbasierter Benchmark speziell für Solidity-Code; die Metrik ist pass@1. Der Autor gibt an, das Modell habe Claude Opus 4 auf demselben Aufgabenset übertroffen. Er weist selbst darauf hin, dass noch weiterer Verbesserungsbedarf besteht, und bittet die Community um Feedback. Das Projekt war nach eigenen Angaben mit erheblichem Zeitaufwand und Trainingskosten verbunden. Unabhängige Reproduktionen oder offizielle Benchmark-Zahlen liegen bislang nicht vor.

Was wir noch wissen

Modell: samscrack/Qwen3.6-Solidity-27B, verfügbar auf HuggingFace
Basis-Modell: Qwen3.6-27B, feinabgestimmt auf Solidity-Code-Aufgaben
Benchmark: SolEval pass@1 — Vergleich gegen Claude Opus 4 auf identischem Aufgabenset
Entwickler beschreibt erhebliche Kosten und Zeitaufwand; Projekt ursprünglich als Wochenendprojekt geplant
Kein unabhängiges Audit; Ergebnisse bislang nur vom Autor selbst kommuniziert

Quelle lesenreddit.com

Foundation Modelle Open Source Coding Assistenten

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Solidity LM: Qwen3.6-27B-Finetuning schlägt Claude Opus 4 auf SolEval

ToolsClaude Qwen Hugging Face

CompaniesHugging Face

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Modell: samscrack/Qwen3.6-Solidity-27B, verfügbar auf HuggingFace
Basis-Modell: Qwen3.6-27B, feinabgestimmt auf Solidity-Code-Aufgaben
Benchmark: SolEval pass@1 — Vergleich gegen Claude Opus 4 auf identischem Aufgabenset
Entwickler beschreibt erhebliche Kosten und Zeitaufwand; Projekt ursprünglich als Wochenendprojekt geplant
Kein unabhängiges Audit; Ergebnisse bislang nur vom Autor selbst kommuniziert

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Solidity LM: Qwen3.6-27B-Finetuning schlägt Claude Opus 4 auf SolEval

Frag die KI zum Artikel

Verwandte Beiträge

Solidity LM: Qwen3.6-27B-Finetuning schlägt Claude Opus 4 auf SolEval

Frag die KI zum Artikel

Verwandte Beiträge