
Microsoft Research veröffentlicht Webwright: Web-Agent-Framework erreicht 60,1 % auf Odysseys
Microsoft Research hat Webwright als Open-Source-Framework veröffentlicht, das die Automatisierung von Web-Aufgaben neu ansetzt: Statt flüchtiger Click-Traces generiert es wiederverwendbare Playwright-Skripte, die eine deterministischere Ausführung ermöglichen. Das Framework besteht aus einem einzigen Agenten-Loop über drei Module und umfasst rund 1.000 Zeilen Code – ein bewusst schlankes Design. Mit GPT-5.4 als Backbone erreicht Webwright 60,1 % auf dem anspruchsvollen Odysseys-Benchmark für long-horizon Web-Aufgaben, was eine Steigerung von 33,5 % des Basis-Modells bedeutet. Auf Online-Mind2Web erzielt das Framework 86,7 % – den höchsten AutoEval-Score unter allen quelloffenen Harness-Rezepten. Die Veröffentlichung als Open-Source-Projekt richtet sich an Entwickler, die Web-Agent-Harnesses aufbauen oder evaluieren wollen.
- Webwright nutzt wiederverwendbare Playwright-Skripte statt einmaliger Click-Traces für stabilere Web-Automatisierung.
- Das Framework besteht aus einem einzigen Agenten-Loop über drei Module bei ~1.000 Zeilen Code.
- 86,7 % auf Online-Mind2Web ist der höchste AutoEval-Score unter allen open-source Harness-Rezepten.
- Webwright ist als Open-Source-Projekt veröffentlicht und damit direkt für eigene Evaluierungen adaptierbar.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHmarktechpost.com6d
Microsoft veröffentlicht Fara1.5: Browser-Agenten-Familie schlägt OpenAI Operator und Gemini 2.5
- FORSCHUNGarxiv.org0mo
Odysseys: Neuer Benchmark testet Web-Agents auf realistischen Langzeit-Aufgaben
- FORSCHUNGhuggingface.co3w
InteractWeb-Bench: Erster multimodaler Benchmark für interaktive Website-Generierung
- LAUNCHreddit.com2w
TextWeb: Markdown-Browser für LLM-Agenten ohne Vision-Modell

Microsoft Research veröffentlicht Webwright: Web-Agent-Framework erreicht 60,1 % auf Odysseys
Microsoft Research hat Webwright als Open-Source-Framework veröffentlicht, das die Automatisierung von Web-Aufgaben neu ansetzt: Statt flüchtiger Click-Traces generiert es wiederverwendbare Playwright-Skripte, die eine deterministischere Ausführung ermöglichen. Das Framework besteht aus einem einzigen Agenten-Loop über drei Module und umfasst rund 1.000 Zeilen Code – ein bewusst schlankes Design. Mit GPT-5.4 als Backbone erreicht Webwright 60,1 % auf dem anspruchsvollen Odysseys-Benchmark für long-horizon Web-Aufgaben, was eine Steigerung von 33,5 % des Basis-Modells bedeutet. Auf Online-Mind2Web erzielt das Framework 86,7 % – den höchsten AutoEval-Score unter allen quelloffenen Harness-Rezepten. Die Veröffentlichung als Open-Source-Projekt richtet sich an Entwickler, die Web-Agent-Harnesses aufbauen oder evaluieren wollen.
- Webwright nutzt wiederverwendbare Playwright-Skripte statt einmaliger Click-Traces für stabilere Web-Automatisierung.
- Das Framework besteht aus einem einzigen Agenten-Loop über drei Module bei ~1.000 Zeilen Code.
- 86,7 % auf Online-Mind2Web ist der höchste AutoEval-Score unter allen open-source Harness-Rezepten.
- Webwright ist als Open-Source-Projekt veröffentlicht und damit direkt für eigene Evaluierungen adaptierbar.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHmarktechpost.com6d
Microsoft veröffentlicht Fara1.5: Browser-Agenten-Familie schlägt OpenAI Operator und Gemini 2.5
- FORSCHUNGarxiv.org0mo
Odysseys: Neuer Benchmark testet Web-Agents auf realistischen Langzeit-Aufgaben
- FORSCHUNGhuggingface.co3w
InteractWeb-Bench: Erster multimodaler Benchmark für interaktive Website-Generierung
- LAUNCHreddit.com2w
TextWeb: Markdown-Browser für LLM-Agenten ohne Vision-Modell