GLM 5.2 übertrifft Claude Code bei IDOR-Sicherheitsbenchmark von Semgrep

Warum es zählt

Für Security-Teams zeigt das Experiment, dass ein offenes Modell (MIT-Lizenz, lokal betreibbar) frontier-Coding-Agents bei spezialisierten Sicherheitsaufgaben übertreffen kann – und das zu einem Bruchteil der Kosten. Gleichzeitig bleibt Semgreps eigene Harness-Pipeline (53–61% F1) deutlich stärker, was die Bedeutung von Scaffolding gegenüber reiner Modellstärke unterstreicht.

— Lumeric Redaktion

Quelle lesensemgrep.dev

Semgrep IDOR Benchmark (F1) · Spitzenwert

57%

Semgrep Multimodal Pipeline

Evals Benchmarks Open Source Coding Assistenten

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

GLM 5.2 übertrifft Claude Code bei IDOR-Sicherheitsbenchmark von Semgrep

ToolsClaude Claude Code Pydantic AI

CompaniesZhipu AI

Warum es zählt

— Lumeric Redaktion

Semgrep IDOR Benchmark (F1) · Spitzenwert

57%

Semgrep Multimodal Pipeline

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

GLM 5.2 übertrifft Claude Code bei IDOR-Sicherheitsbenchmark von Semgrep

Frag die KI zum Artikel

Verwandte Beiträge

GLM 5.2 übertrifft Claude Code bei IDOR-Sicherheitsbenchmark von Semgrep

Frag die KI zum Artikel

Verwandte Beiträge