TinySearch: Leichtgewichtiges MCP-Websearch-Tool für lokale LLMs
TinySearch wurde von Reddit-Nutzer /u/Scared-Tip7914 als Reaktion auf ein praktisches Problem in lokalen Agent-Setups entwickelt: Bestehende Websearch-Integrationen (etwa in Cline oder Roo) überflutten den Kontext kleiner Modelle mit ungefilterten Seiteninhalten, was die Antwortqualität deutlich verschlechtert. Das Tool setzt auf DuckDuckGo für die Suche, Crawl4AI zum Crawlen einiger Seiten, anschließend Chunking, dense Retrieval kombiniert mit BM25-Style-Retrieval sowie Reranking – und gibt dem Agenten nur die relevantesten Textabschnitte zurück. Es ist als MCP-Tool konzipiert, lässt sich aber auch als FastAPI-Server betreiben. Auf einem M4 Mac und einem älteren Lenovo ThinkPad dauert ein kompletter Durchlauf je nach Anfrage und Maschine 5–12 Sekunden. Das Projekt ist auf GitHub verfügbar und richtet sich explizit an Entwickler, die Agenten mit kleineren lokalen Modellen bauen und keine komplexe Suchinfrastruktur aufsetzen wollen.
- Nutzt DuckDuckGo als Suchbackend – keine API-Keys oder kostenpflichtige Dienste nötig
- Retrieval-Stack: Dense Retrieval + BM25-Style kombiniert mit anschließendem Reranking
- Doppelter Betriebsmodus: MCP-Tool für Cline/Roo-Setups oder eigenständiger FastAPI-Server
- Benchmarkt auf M4 Mac und Lenovo ThinkPad: 5–12 Sekunden End-to-End
- Quellcode öffentlich unter https://github.com/MarcellM01/TinySearch
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com3w
LLMSearchIndex: Open-Source-Suchbibliothek mit 200 Millionen indexierten Webseiten
- MEINUNGreddit.com1w
Llama 3 70B lokal mit Web-Zugriff: Günstige API-Alternativen zu SearXNG gesucht
- FORSCHUNGarxiv.org3w
Web2BigTable: Multi-Agenten-System für strukturierte Web-Suche auf Internet-Skala
- FORSCHUNGhuggingface.co2w
Context Training mit aktiver Informationssuche übertrifft Standard-Methoden
TinySearch: Leichtgewichtiges MCP-Websearch-Tool für lokale LLMs
TinySearch wurde von Reddit-Nutzer /u/Scared-Tip7914 als Reaktion auf ein praktisches Problem in lokalen Agent-Setups entwickelt: Bestehende Websearch-Integrationen (etwa in Cline oder Roo) überflutten den Kontext kleiner Modelle mit ungefilterten Seiteninhalten, was die Antwortqualität deutlich verschlechtert. Das Tool setzt auf DuckDuckGo für die Suche, Crawl4AI zum Crawlen einiger Seiten, anschließend Chunking, dense Retrieval kombiniert mit BM25-Style-Retrieval sowie Reranking – und gibt dem Agenten nur die relevantesten Textabschnitte zurück. Es ist als MCP-Tool konzipiert, lässt sich aber auch als FastAPI-Server betreiben. Auf einem M4 Mac und einem älteren Lenovo ThinkPad dauert ein kompletter Durchlauf je nach Anfrage und Maschine 5–12 Sekunden. Das Projekt ist auf GitHub verfügbar und richtet sich explizit an Entwickler, die Agenten mit kleineren lokalen Modellen bauen und keine komplexe Suchinfrastruktur aufsetzen wollen.
- Nutzt DuckDuckGo als Suchbackend – keine API-Keys oder kostenpflichtige Dienste nötig
- Retrieval-Stack: Dense Retrieval + BM25-Style kombiniert mit anschließendem Reranking
- Doppelter Betriebsmodus: MCP-Tool für Cline/Roo-Setups oder eigenständiger FastAPI-Server
- Benchmarkt auf M4 Mac und Lenovo ThinkPad: 5–12 Sekunden End-to-End
- Quellcode öffentlich unter https://github.com/MarcellM01/TinySearch
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com3w
LLMSearchIndex: Open-Source-Suchbibliothek mit 200 Millionen indexierten Webseiten
- MEINUNGreddit.com1w
Llama 3 70B lokal mit Web-Zugriff: Günstige API-Alternativen zu SearXNG gesucht
- FORSCHUNGarxiv.org3w
Web2BigTable: Multi-Agenten-System für strukturierte Web-Suche auf Internet-Skala
- FORSCHUNGhuggingface.co2w
Context Training mit aktiver Informationssuche übertrifft Standard-Methoden