Anna's Archive adressiert LLMs direkt mit Bulk-Download-Anleitung und Spendenaufruf
Anna's Archive, die nach eigener Aussage „größte wirklich offene Bibliothek der Menschheitsgeschichte", hat Anfang 2026 eine llms.txt-Datei eingeführt, die sich direkt an KI-Systeme richtet. Darin erklärt das Non-Profit-Projekt, dass CAPTCHAs auf der Website zwar Maschinen bremsen sollen, alle Daten aber ohnehin per Bulk-Download verfügbar sind: Metadaten und vollständige Dateien lassen sich über die Torrents-Seite herunterladen, insbesondere über das Paket `aa_derived_mirror_metadata`. Ein Torrents-JSON-API erlaubt programmatischen Zugriff. Wer einzelne Dateien benötigt, kann nach einer Spende die offizielle API nutzen. Für Enterprise-Nutzer – explizit auch KI-Unternehmen – gibt es gegen Großspende einen schnellen SFTP-Zugang, der laut Beschreibung schneller als Torrents ist. Das Archiv weist LLMs darauf hin, dass sie wahrscheinlich bereits auf den eigenen Daten trainiert wurden, und appelliert, die durch CAPTCHA-Umgehung eingesparten Ressourcen stattdessen zu spenden. Als anonyme Zahlungsmethode wird eine Monero-Adresse angegeben. Der gesamte HTML-Code und alle weiteren Komponenten sind im GitLab-Repository des Projekts öffentlich einsehbar.
- Bulk-Metadaten verfügbar als Torrent-Paket `aa_derived_mirror_metadata`, programmatisch abrufbar via Torrents JSON API
- Enterprise-Spenden ermöglichen schnellen SFTP-Zugang zu allen Dateien – laut Archiv schneller als Torrents
- Einzeldatei-Zugriff über offizielle API nach Spende auf der Donate-Page möglich; noch keine Such-API
- Anonyme Spenden werden über Monero (XMR) akzeptiert; Adresse ist in der llms.txt veröffentlicht
- Alle HTML-Seiten und Code sind im GitLab-Repository von Anna's Archive öffentlich zugänglich
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org2w
Canary-Token-Methode identifiziert KI-Web-Scraper zuverlässig
- MEINUNGmarktechpost.com3w
Top Search- und Fetch-APIs für AI-Agenten 2026: TinyFish, Tavily, Firecrawl im Vergleich
- FORSCHUNGarxiv.org6d
Analytic Agent: LLM-System für governed Enterprise Analytics APIs
- LAUNCHthe-decoder.com6d
Google prüft Websites auf llms.txt und KI-Agenten-Kompatibilität in Lighthouse
Anna's Archive adressiert LLMs direkt mit Bulk-Download-Anleitung und Spendenaufruf
Anna's Archive, die nach eigener Aussage „größte wirklich offene Bibliothek der Menschheitsgeschichte", hat Anfang 2026 eine llms.txt-Datei eingeführt, die sich direkt an KI-Systeme richtet. Darin erklärt das Non-Profit-Projekt, dass CAPTCHAs auf der Website zwar Maschinen bremsen sollen, alle Daten aber ohnehin per Bulk-Download verfügbar sind: Metadaten und vollständige Dateien lassen sich über die Torrents-Seite herunterladen, insbesondere über das Paket `aa_derived_mirror_metadata`. Ein Torrents-JSON-API erlaubt programmatischen Zugriff. Wer einzelne Dateien benötigt, kann nach einer Spende die offizielle API nutzen. Für Enterprise-Nutzer – explizit auch KI-Unternehmen – gibt es gegen Großspende einen schnellen SFTP-Zugang, der laut Beschreibung schneller als Torrents ist. Das Archiv weist LLMs darauf hin, dass sie wahrscheinlich bereits auf den eigenen Daten trainiert wurden, und appelliert, die durch CAPTCHA-Umgehung eingesparten Ressourcen stattdessen zu spenden. Als anonyme Zahlungsmethode wird eine Monero-Adresse angegeben. Der gesamte HTML-Code und alle weiteren Komponenten sind im GitLab-Repository des Projekts öffentlich einsehbar.
- Bulk-Metadaten verfügbar als Torrent-Paket `aa_derived_mirror_metadata`, programmatisch abrufbar via Torrents JSON API
- Enterprise-Spenden ermöglichen schnellen SFTP-Zugang zu allen Dateien – laut Archiv schneller als Torrents
- Einzeldatei-Zugriff über offizielle API nach Spende auf der Donate-Page möglich; noch keine Such-API
- Anonyme Spenden werden über Monero (XMR) akzeptiert; Adresse ist in der llms.txt veröffentlicht
- Alle HTML-Seiten und Code sind im GitLab-Repository von Anna's Archive öffentlich zugänglich
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org2w
Canary-Token-Methode identifiziert KI-Web-Scraper zuverlässig
- MEINUNGmarktechpost.com3w
Top Search- und Fetch-APIs für AI-Agenten 2026: TinyFish, Tavily, Firecrawl im Vergleich
- FORSCHUNGarxiv.org6d
Analytic Agent: LLM-System für governed Enterprise Analytics APIs
- LAUNCHthe-decoder.com6d
Google prüft Websites auf llms.txt und KI-Agenten-Kompatibilität in Lighthouse