
GLM 5.2 übertrifft Claude Code bei IDOR-Sicherheitsbenchmark von Semgrep
CompaniesZhipu AI
Warum es zählt
Für Security-Teams zeigt das Experiment, dass ein offenes Modell (MIT-Lizenz, lokal betreibbar) frontier-Coding-Agents bei spezialisierten Sicherheitsaufgaben übertreffen kann – und das zu einem Bruchteil der Kosten. Gleichzeitig bleibt Semgreps eigene Harness-Pipeline (53–61% F1) deutlich stärker, was die Bedeutung von Scaffolding gegenüber reiner Modellstärke unterstreicht.
— Lumeric Redaktion
Semgrep IDOR Benchmark (F1) · Spitzenwert
57%
Semgrep Multimodal Pipeline
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge

GLM 5.2 übertrifft Claude Code bei IDOR-Sicherheitsbenchmark von Semgrep
CompaniesZhipu AI
Warum es zählt
Für Security-Teams zeigt das Experiment, dass ein offenes Modell (MIT-Lizenz, lokal betreibbar) frontier-Coding-Agents bei spezialisierten Sicherheitsaufgaben übertreffen kann – und das zu einem Bruchteil der Kosten. Gleichzeitig bleibt Semgreps eigene Harness-Pipeline (53–61% F1) deutlich stärker, was die Bedeutung von Scaffolding gegenüber reiner Modellstärke unterstreicht.
— Lumeric Redaktion
Semgrep IDOR Benchmark (F1) · Spitzenwert
57%
Semgrep Multimodal Pipeline
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.