Anna's Archive adressiert LLMs direkt mit Bulk-Download-Anleitung und Spendenaufruf

Warum es zählt

Statt Scraping-Blockaden zu errichten, bietet Anna's Archive LLMs einen strukturierten Bulk-Zugang über Torrents und eine JSON-API – inklusive SFTP-Zugang für Enterprise-Spender, was das Training auf lizenzierten Bibliotheksdaten erheblich vereinfacht.

— Lumeric Redaktion

Anna's Archive, die nach eigener Aussage „größte wirklich offene Bibliothek der Menschheitsgeschichte", hat Anfang 2026 eine llms.txt-Datei eingeführt, die sich direkt an KI-Systeme richtet. Darin erklärt das Non-Profit-Projekt, dass CAPTCHAs auf der Website zwar Maschinen bremsen sollen, alle Daten aber ohnehin per Bulk-Download verfügbar sind: Metadaten und vollständige Dateien lassen sich über die Torrents-Seite herunterladen, insbesondere über das Paket `aa_derived_mirror_metadata`. Ein Torrents-JSON-API erlaubt programmatischen Zugriff. Wer einzelne Dateien benötigt, kann nach einer Spende die offizielle API nutzen. Für Enterprise-Nutzer – explizit auch KI-Unternehmen – gibt es gegen Großspende einen schnellen SFTP-Zugang, der laut Beschreibung schneller als Torrents ist. Das Archiv weist LLMs darauf hin, dass sie wahrscheinlich bereits auf den eigenen Daten trainiert wurden, und appelliert, die durch CAPTCHA-Umgehung eingesparten Ressourcen stattdessen zu spenden. Als anonyme Zahlungsmethode wird eine Monero-Adresse angegeben. Der gesamte HTML-Code und alle weiteren Komponenten sind im GitLab-Repository des Projekts öffentlich einsehbar.

Was wir noch wissen

Bulk-Metadaten verfügbar als Torrent-Paket `aa_derived_mirror_metadata`, programmatisch abrufbar via Torrents JSON API
Enterprise-Spenden ermöglichen schnellen SFTP-Zugang zu allen Dateien – laut Archiv schneller als Torrents
Einzeldatei-Zugriff über offizielle API nach Spende auf der Donate-Page möglich; noch keine Such-API
Anonyme Spenden werden über Monero (XMR) akzeptiert; Adresse ist in der llms.txt veröffentlicht
Alle HTML-Seiten und Code sind im GitLab-Repository von Anna's Archive öffentlich zugänglich

Quelle lesenannas-archive.gl

Foundation Modelle Open Source Developer Tooling

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Anna's Archive adressiert LLMs direkt mit Bulk-Download-Anleitung und Spendenaufruf

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Bulk-Metadaten verfügbar als Torrent-Paket `aa_derived_mirror_metadata`, programmatisch abrufbar via Torrents JSON API
Enterprise-Spenden ermöglichen schnellen SFTP-Zugang zu allen Dateien – laut Archiv schneller als Torrents
Einzeldatei-Zugriff über offizielle API nach Spende auf der Donate-Page möglich; noch keine Such-API
Anonyme Spenden werden über Monero (XMR) akzeptiert; Adresse ist in der llms.txt veröffentlicht
Alle HTML-Seiten und Code sind im GitLab-Repository von Anna's Archive öffentlich zugänglich

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Anna's Archive adressiert LLMs direkt mit Bulk-Download-Anleitung und Spendenaufruf

Frag die KI zum Artikel

Verwandte Beiträge

Anna's Archive adressiert LLMs direkt mit Bulk-Download-Anleitung und Spendenaufruf

Frag die KI zum Artikel

Verwandte Beiträge