AI-Glossar
Die wichtigsten Begriffe rund um AI, Modelle, Agents und Infrastruktur — kurz und präzise auf Deutsch erklärt. 81 Einträge in 10 Kategorien.
Trending diese Woche
Modell-Architektur
- Attention⚡neu · 20×
Mechanismus, mit dem ein Modell Token-Beziehungen im Input gewichtet — bestimmt, welche Teile des Kontexts für die Vorhersage des nächsten Tokens wichtig sind. Kern-Operation im Transformer.
- Context Window⚡neu · 14×
Maximale Token-Anzahl, die ein LLM in einem Request verarbeiten kann (Input + Output). 2026-Stand: GPT-5 ~256k, Claude Sonnet 4.6 ~1M, Gemini 2.5 ~2M Tokens.
- Embedding⚡neu · 40×
Vektor-Repräsentation eines Texts/Bildes/Audios in einem hochdimensionalen Raum (typisch 768-3072 Dimensionen). Semantisch ähnliche Inhalte → räumlich nahe Vektoren. Basis für Vector-DBs und Semantic-Search.
- Emergence
Training & Inferenz
- Distillation⚡neu · 41×
Trainiert ein kleineres „Student"-Modell, um die Outputs eines grösseren „Teacher"-Modells zu imitieren. Resultat: 80% der Qualität bei 10% der Inferenz-Kosten. DeepSeek-R1 distilliert in viele Open-Source-Varianten.
- Fine-Tuning⚡neu · 100×
Weiter-Training eines Pretrained-Modells auf domänenspezifischem Datenset (Medizin, Recht, Code). Macht Modelle für Nischen brauchbar, ohne von Null zu trainieren. LoRA oder QLoRA reduzieren Memory-Bedarf.
- Inference⚡neu · 234×
Phase, in der ein trainiertes Modell tatsächlich Vorhersagen produziert (Antwort generieren, Bild klassifizieren). Im Gegensatz zum Training. Ökonomisch wichtigster Kosten-Block bei Live-Anwendungen.
Agents & Reasoning
- Agent⚡neu · 20×
LLM-System, das eigenständig Aktionen plant + ausführt (Tool-Calls, Web-Search, Code-Exec). Gegensatz zum Single-Turn-Chatbot. Beispiele: Devin, Manus, Replit Agent.
- Chain-of-Thought (CoT)⚡neu · 32×
Prompting-Technik: das Modell wird angewiesen, Schritt für Schritt zu denken („Think step by step"), bevor es die finale Antwort gibt. Verbessert Math/Logic massiv. Reasoning-Models machen CoT intern automatisch.
- Chatbot⚡neu · 10×
Conversational-Interface auf Basis eines LLM. Heutiges ChatGPT-Paradigma. Aber: nicht jede LLM-Anwendung ist ein Chatbot — Agents, Co-Pilots, Background-Jobs sind eigene Patterns.
- Co-Pilot
RAG & Memory
- Context Caching
API-Feature (Anthropic, Google), das einmal hochgeladene grosse Kontexte (PDFs, Dokumentation) für Folge-Requests cached. Reduziert Input-Token-Kosten ~80% bei wiederholten Queries auf gleichen Kontext.
- HNSW⚡neu · 1×
Hierarchical Navigable Small World — Index-Algorithmus für Approximate-Nearest-Neighbor-Suche in Vector-DBs. De-facto-Standard 2026: balanciert Query-Latency vs. Index-Size besser als IVF oder Brute-Force.
- RAG — Retrieval-Augmented Generation⚡neu · 44×
Architektur: User-Frage → Vector-Suche in Wissensdatenbank → Top-K Treffer als Kontext an LLM → LLM antwortet basierend auf diesem Kontext. Standard für domänenspezifische Bots ohne Fine-Tuning.
- Semantic Search
Multimodal
- CLIP⚡neu · 19×
Contrastive Language-Image Pre-training — OpenAI-Modell (2021), das Bild und Text in einen gemeinsamen Embedding-Raum mappt. Kern-Komponente vieler Image-Generation- und Search-Pipelines.
- Computer-Use⚡neu · 1×
LLM-Fähigkeit, einen Bildschirm zu „sehen" + Maus/Keyboard zu steuern. Anthropic Computer Use (2024), OpenAI Operator. Vorstufe zu universellen Desktop-Agents.
- Diffusion Model⚡neu · 19×
Generativer Modell-Typ, der aus Rauschen iterativ Bilder/Videos rekonstruiert. Basis für Stable Diffusion, FLUX, Sora, Imagen. Trade-off: höhere Qualität als GANs, dafür langsamere Inferenz.
- Multimodal
Voice & Audio
- ASR / STT⚡neu · 11×
Automatic Speech Recognition / Speech-to-Text — Audio → Transkription. Whisper (OpenAI) ist der Open-Source-Standard. Realtime-Latency wichtig für Voice-Agents.
- TTS — Text-to-Speech⚡neu · 8×
Wandelt Text in synthetische Sprache um. 2026-Stand: kaum von menschlicher Sprache unterscheidbar (ElevenLabs, Cartesia). Lumeric-Briefing nutzt ElevenLabs für die tägliche Audio-Version.
- Voice Cloning⚡neu · 3×
Aus einer kurzen Audio-Probe (~30s) wird eine synthetische Stimme erzeugt, die der Original-Stimme ähnelt. Ethik-Hot-Spot. ElevenLabs, Resemble. Lumeric verzichtet bewusst — eine konsistente Brand-Stimme statt User-Cloning.
- Whisper
Robotics
- Embodied AI⚡neu · 3×
KI in physischen Systemen (Roboter, autonomous vehicles), die mit der echten Welt interagieren. Anders als Web-Agents: Physik, Sensoren, Latenz, Sicherheit. Aktive Player: Figure, 1X, Tesla Optimus.
- Sim-to-Real⚡neu · 6×
Trainings-Strategie: Roboter lernen Skills in der Simulation (Millionen Trial-and-Error-Iterationen), dann Transfer in die echte Welt. Spart Hardware-Verschleiss + Zeit.
- VLA — Vision-Language-Action⚡neu · 5×
Modell-Klasse, die visuellen Input + Sprach-Anweisung in physische Roboter-Aktionen übersetzt. Foundation-Models für Robotics: Pi-Zero (Physical Intelligence), Helix (Figure).
- World Model
Evaluation
- ARC-AGI
Abstract Reasoning Corpus von François Chollet. Visuelle Pattern-Tasks, die Menschen mühelos lösen, LLMs aber struggeln lassen. Galt 2024 als „letzter ungelöster" AI-Benchmark — Frontier-Modelle nähern sich 2026 menschlichem Niveau.
- Benchmark⚡neu · 276×
Standardisierter Test, gegen den Modelle vermessen werden. Beispiele: MMLU (Wissen), HumanEval (Code), GSM8K (Math), AIME (Olympiade-Math), ARC-AGI (abstraktes Reasoning).
- Eval-Harness⚡neu · 1×
Standardisiertes Test-Framework, in dem ein Modell gegen viele Benchmarks gleichzeitig läuft. Bekannt: lm-evaluation-harness von EleutherAI. Open-Source-Modelle werden so vergleichbar gemacht.
- Hallucination
Safety & Alignment
- AGI⚡neu · 3×
Artificial General Intelligence — KI, die jeden kognitiven Task auf menschlichem Niveau lösen kann. Definition kontrovers; OpenAI-Charta nennt es als Mission. Zeitpunkt schwer prognostizierbar — Schätzungen 2026 reichen von 3 bis 30 Jahre.
- Alignment⚡neu · 125×
Forschungsfeld: wie kriegt man fortgeschrittene KI dazu, Ziele und Werte mit Menschen abzustimmen. Anthropic + DeepMind investieren viel; OpenAI hat 2024 das Superalignment-Team aufgelöst.
- ASI
Artificial Superintelligence — hypothetische KI, die Menschen in jeder kognitiven Disziplin substantiell übertrifft. Spätere Stufe nach AGI. Zentral für Safety-Diskussion (Alignment-Problem).
- Constitutional AI
Infrastruktur
- Apache 2.0 / MIT⚡neu · 2×
Permissive Open-Source-Lizenzen. Erlauben kommerzielle Nutzung, Modifikation, Weitergabe ohne Restriktionen. Kontrast: Llama-Lizenz hat Beschränkungen für Konkurrenten >700M Nutzer.
- API-Pricing⚡neu · 1×
LLM-API-Kosten pro 1M Input-/Output-Tokens. Frontier-Models 2026: Claude Opus ~$15/$75, GPT-5 ~$10/$30, Gemini Pro ~$5/$15. Open-Source-Hosted via Together/Fireworks 5-20× günstiger.
- Cold Start⚡neu · 9×
Verzögerung beim ersten Request nach Idle — Container muss hochgefahren, Modell-Gewichte ins GPU-Memory geladen werden. Bei 70B-Modellen 30-90s. Mitigated durch Warm-Pools.
- GPU