Qwen/WebWorld: Open-Source Web-World-Model-Serie auf Basis von Qwen3
WebWorld ist eine Open-Weight-World-Model-Serie des Qwen-Teams, feinabgestimmt auf Basis von Qwen3 in den Varianten 32B, 14B und 8B. Das Training basiert auf über einer Million realer Web-Interaktions-Trajektorien, die über eine skalierbare hierarchische Datenpipeline gesammelt wurden. Unterstützt werden Long-Horizon-Simulationen mit mehr als 30 Schritten sowie multiple State-Repräsentationen wie A11y Tree, HTML, XML, Markdown und natürliche Sprache. Chain-of-Thought-Reasoning (CoT) wird für Zustandsübergangs-Vorhersagen eingesetzt. Besonders relevant: Agenten, die auf von WebWorld synthetisierten Trajektorien trainiert werden, verbessern sich um +9,9 % auf MiniWob++ und +10,9 % auf WebArena gegenüber der Baseline. Beim Einsatz als World Model für Inference-Time-Lookahead-Search übertrifft WebWorld-32B nach eigenen Angaben GPT-5. Die Modelle sind auf Hugging Face unter den Bezeichnungen WebWorld-32B, -14B und -8B frei verfügbar und unterstützen Cross-Domain-Generalisierung auf Code-, GUI- und Game-Umgebungen.
- Drei Modellgrößen verfügbar: WebWorld-32B, -14B und -8B, alle auf Hugging Face abrufbar
- Training auf 1M+ realen Web-Interaktions-Trajektorien über hierarchische Datenpipeline
- Unterstützt A11y Tree, HTML, XML, Markdown und natürliche Sprache als State-Repräsentationen
- Long-Horizon-Simulation mit 30+ Schritten und CoT-aktiviertem Reasoning für Transition-Prediction
- Cross-Domain-Generalisierung auf Code-, GUI- und Game-Umgebungen explizit genannt
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- BENCHMARKreddit.com1d
Qwen3.5 4B als PI-Agent: SOTA auf TerminalBench in der 4B-Klasse
- FORSCHUNGarxiv.org2w
Weblica: Skalierbares RL-Training für visuelle Web-Agenten mit tausenden Umgebungen
- FORSCHUNGarxiv.org1w
Weasel: Trajectory-Selektion für bessere Out-of-Domain-Generalisierung von Web-Agenten
- FORSCHUNGarxiv.org1w
WebServ: RL-fähige Web-Umgebung trainiert Qwen3-4B auf 55,5 % bei WebArena-Lite
Qwen/WebWorld: Open-Source Web-World-Model-Serie auf Basis von Qwen3
WebWorld ist eine Open-Weight-World-Model-Serie des Qwen-Teams, feinabgestimmt auf Basis von Qwen3 in den Varianten 32B, 14B und 8B. Das Training basiert auf über einer Million realer Web-Interaktions-Trajektorien, die über eine skalierbare hierarchische Datenpipeline gesammelt wurden. Unterstützt werden Long-Horizon-Simulationen mit mehr als 30 Schritten sowie multiple State-Repräsentationen wie A11y Tree, HTML, XML, Markdown und natürliche Sprache. Chain-of-Thought-Reasoning (CoT) wird für Zustandsübergangs-Vorhersagen eingesetzt. Besonders relevant: Agenten, die auf von WebWorld synthetisierten Trajektorien trainiert werden, verbessern sich um +9,9 % auf MiniWob++ und +10,9 % auf WebArena gegenüber der Baseline. Beim Einsatz als World Model für Inference-Time-Lookahead-Search übertrifft WebWorld-32B nach eigenen Angaben GPT-5. Die Modelle sind auf Hugging Face unter den Bezeichnungen WebWorld-32B, -14B und -8B frei verfügbar und unterstützen Cross-Domain-Generalisierung auf Code-, GUI- und Game-Umgebungen.
- Drei Modellgrößen verfügbar: WebWorld-32B, -14B und -8B, alle auf Hugging Face abrufbar
- Training auf 1M+ realen Web-Interaktions-Trajektorien über hierarchische Datenpipeline
- Unterstützt A11y Tree, HTML, XML, Markdown und natürliche Sprache als State-Repräsentationen
- Long-Horizon-Simulation mit 30+ Schritten und CoT-aktiviertem Reasoning für Transition-Prediction
- Cross-Domain-Generalisierung auf Code-, GUI- und Game-Umgebungen explizit genannt
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- BENCHMARKreddit.com1d
Qwen3.5 4B als PI-Agent: SOTA auf TerminalBench in der 4B-Klasse
- FORSCHUNGarxiv.org2w
Weblica: Skalierbares RL-Training für visuelle Web-Agenten mit tausenden Umgebungen
- FORSCHUNGarxiv.org1w
Weasel: Trajectory-Selektion für bessere Out-of-Domain-Generalisierung von Web-Agenten
- FORSCHUNGarxiv.org1w
WebServ: RL-fähige Web-Umgebung trainiert Qwen3-4B auf 55,5 % bei WebArena-Lite