TextWeb: Markdown-Browser für LLM-Agenten ohne Vision-Modell
TextWeb ist ein Open-Source-Projekt von GitHub-Nutzer woheller69, das Webseiten als Markdown aufbereitet, sodass LLM-Agenten diese ohne Vision-Modelle verarbeiten können. Statt teurer Screenshot-Pipelines rendert TextWeb Seiten inklusive vollständiger JavaScript-Ausführung; interaktive Elemente wie Eingabefelder und Buttons werden annotiert und bleiben für den Agenten nutzbar. Der Agent kann Aktionen wie Scrollen, Texteingaben und Klicks ausführen – funktionale Web-Interaktion also rein auf Textbasis. Das Projekt liefert sowohl eine CLI als auch einen MCP-Server und ist laut dem Ersteller /u/DocWolle kompatibel mit der llama.cpp Web-UI. Es baut auf dem Vorläuferprojekt von chrisrobison auf, das ein textgitterbasiertes Rendering nutzte; TextWeb ersetzt dieses durch Markdown für bessere LLM-Kompatibilität.
- Rendert Webseiten als Markdown statt als Screenshot – kein Vision-Modell nötig
- Unterstützt vollständige JavaScript-Ausführung und annotiert interaktive Seitenelemente
- Bietet CLI und MCP-Server für flexible Integration in Agent-Pipelines
- Kompatibel mit llama.cpp Web-UI
- Basiert auf dem Textgitter-Renderer von chrisrobison/textweb
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
TextWeb: Markdown-Browser für LLM-Agenten ohne Vision-Modell
TextWeb ist ein Open-Source-Projekt von GitHub-Nutzer woheller69, das Webseiten als Markdown aufbereitet, sodass LLM-Agenten diese ohne Vision-Modelle verarbeiten können. Statt teurer Screenshot-Pipelines rendert TextWeb Seiten inklusive vollständiger JavaScript-Ausführung; interaktive Elemente wie Eingabefelder und Buttons werden annotiert und bleiben für den Agenten nutzbar. Der Agent kann Aktionen wie Scrollen, Texteingaben und Klicks ausführen – funktionale Web-Interaktion also rein auf Textbasis. Das Projekt liefert sowohl eine CLI als auch einen MCP-Server und ist laut dem Ersteller /u/DocWolle kompatibel mit der llama.cpp Web-UI. Es baut auf dem Vorläuferprojekt von chrisrobison auf, das ein textgitterbasiertes Rendering nutzte; TextWeb ersetzt dieses durch Markdown für bessere LLM-Kompatibilität.
- Rendert Webseiten als Markdown statt als Screenshot – kein Vision-Modell nötig
- Unterstützt vollständige JavaScript-Ausführung und annotiert interaktive Seitenelemente
- Bietet CLI und MCP-Server für flexible Integration in Agent-Pipelines
- Kompatibel mit llama.cpp Web-UI
- Basiert auf dem Textgitter-Renderer von chrisrobison/textweb
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.