Solidity LM: Qwen3.6-27B-Finetuning schlägt Claude Opus 4 auf SolEval
Der Reddit-Nutzer /u/swingbear hat ein Wochenendprojekt veröffentlicht, das etwas länger als geplant dauerte: ein Finetuning von Qwen3.6-27B auf Solidity, der Programmiersprache für Ethereum-Smart-Contracts. Das daraus resultierende Modell „Qwen3.6-Solidity-27B" ist auf HuggingFace unter dem Account samscrack verfügbar. Als Vergleichsmaßstab dient SolEval, ein aufgabenbasierter Benchmark speziell für Solidity-Code; die Metrik ist pass@1. Der Autor gibt an, das Modell habe Claude Opus 4 auf demselben Aufgabenset übertroffen. Er weist selbst darauf hin, dass noch weiterer Verbesserungsbedarf besteht, und bittet die Community um Feedback. Das Projekt war nach eigenen Angaben mit erheblichem Zeitaufwand und Trainingskosten verbunden. Unabhängige Reproduktionen oder offizielle Benchmark-Zahlen liegen bislang nicht vor.
- Modell: samscrack/Qwen3.6-Solidity-27B, verfügbar auf HuggingFace
- Basis-Modell: Qwen3.6-27B, feinabgestimmt auf Solidity-Code-Aufgaben
- Benchmark: SolEval pass@1 — Vergleich gegen Claude Opus 4 auf identischem Aufgabenset
- Entwickler beschreibt erhebliche Kosten und Zeitaufwand; Projekt ursprünglich als Wochenendprojekt geplant
- Kein unabhängiges Audit; Ergebnisse bislang nur vom Autor selbst kommuniziert
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org2w
SmartEval: Benchmark für LLM-generierte Solidity Smart Contracts
- BENCHMARKreddit.com3w
Backend-Generierung: Local LLMs schließen zur Frontier auf
- MEINUNGreddit.com1w
Qwen 35B A3B überzeugt im Agentic-Coding-Einsatz auf Consumer-Hardware
- MEINUNGreddit.com3w
Qwen 3.6 in Echtzeit-Projekt gescheitert: Developer beklagt mangelnde Coding-Fähigkeiten
Solidity LM: Qwen3.6-27B-Finetuning schlägt Claude Opus 4 auf SolEval
Der Reddit-Nutzer /u/swingbear hat ein Wochenendprojekt veröffentlicht, das etwas länger als geplant dauerte: ein Finetuning von Qwen3.6-27B auf Solidity, der Programmiersprache für Ethereum-Smart-Contracts. Das daraus resultierende Modell „Qwen3.6-Solidity-27B" ist auf HuggingFace unter dem Account samscrack verfügbar. Als Vergleichsmaßstab dient SolEval, ein aufgabenbasierter Benchmark speziell für Solidity-Code; die Metrik ist pass@1. Der Autor gibt an, das Modell habe Claude Opus 4 auf demselben Aufgabenset übertroffen. Er weist selbst darauf hin, dass noch weiterer Verbesserungsbedarf besteht, und bittet die Community um Feedback. Das Projekt war nach eigenen Angaben mit erheblichem Zeitaufwand und Trainingskosten verbunden. Unabhängige Reproduktionen oder offizielle Benchmark-Zahlen liegen bislang nicht vor.
- Modell: samscrack/Qwen3.6-Solidity-27B, verfügbar auf HuggingFace
- Basis-Modell: Qwen3.6-27B, feinabgestimmt auf Solidity-Code-Aufgaben
- Benchmark: SolEval pass@1 — Vergleich gegen Claude Opus 4 auf identischem Aufgabenset
- Entwickler beschreibt erhebliche Kosten und Zeitaufwand; Projekt ursprünglich als Wochenendprojekt geplant
- Kein unabhängiges Audit; Ergebnisse bislang nur vom Autor selbst kommuniziert
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org2w
SmartEval: Benchmark für LLM-generierte Solidity Smart Contracts
- BENCHMARKreddit.com3w
Backend-Generierung: Local LLMs schließen zur Frontier auf
- MEINUNGreddit.com1w
Qwen 35B A3B überzeugt im Agentic-Coding-Einsatz auf Consumer-Hardware
- MEINUNGreddit.com3w
Qwen 3.6 in Echtzeit-Projekt gescheitert: Developer beklagt mangelnde Coding-Fähigkeiten