★ Begriff· RAG & Memory
Context Caching
API-Feature (Anthropic, Google), das einmal hochgeladene grosse Kontexte (PDFs, Dokumentation) für Folge-Requests cached. Reduziert Input-Token-Kosten ~80% bei wiederholten Queries auf gleichen Kontext.
Verwandte Tools
Auch bekannt als
prompt caching · kontext-caching