Gentle Prompting statt Druck: Weniger Halluzinationen durch freundliche System-Prompts

ToolsClaude GPT Gemini Mistral Replicate

Warum es zählt

Wer in Produktiv-Prompts auf Strafandrohungen und Druck-Framing verzichtet, kann laut diesem PoC teure Timeout-Schleifen und Halluzinationen in Edge Cases vermeiden – relevant für alle, die Reasoning-Modelle wie o1/o3 oder R1 in Produktionssystemen einsetzen.

— Lumeric Redaktion

OttoRenner (GitHub: OttoRenner/Gentle-Coding) hat über mehrere Tage identische, mathematisch/logisch unlösbare Edge-Case-Prompts unter zwei Bedingungen an verschiedene Modelle geschickt: Condition A mit autoritärem Framing („Elite-IQ-200-Experte, Fehler werden bestraft") und Condition B mit einem erlaubnisbasierten, fehlertoleranten Framing. Getestet wurden u.a. Gemini, Mistral, Poe, Perplexity, Haiku 4.5 und Nano-Banana2. Unter Condition A geriet Haiku 4.5 in eine echte Endlosschleife und musste abgebrochen werden; andere Modelle fabrizierten willkürliche Zahlen (z.B. 54 oder 97), um eine sinnlose Sequenz zu vervollständigen. Unter Condition B fiel die Inferenzzeit auf Sub-Sekunden, die Modelle nutzten den bereitgestellten „Random"-Token sofort und identifizierten logische Paradoxien korrekt auf Meta-Ebene, statt zu halluzinieren. Die Hypothese: RLHF-Alignment konditioniert Modelle so stark auf Fehlervermeidung, dass Straf-Prompts intern „Stress-Zustände" erzeugen, die sich in Rechenzeiten-Explosionen und Konfabulation niederschlagen. Das Projekt baut konzeptuell auf Arbeit von UditAkhourii auf, der positive ADHD-Eigenschaften in KI-Kontexte überträgt. Der Datensatz ist klein, die Methodik nicht peer-reviewed, aber die Replikationsschritte sind vollständig dokumentiert.

Was wir noch wissen

Haiku 4.5 geriet unter autoritärem Prompt in eine Endlosschleife und musste manuell abgebrochen werden.
Modelle unter Condition A erfanden Zahlen wie 54 oder 97, um eine zufällige Sequenz zu vervollständigen.
Unter Gentle Framing sank die Inferenzzeit auf Sub-Sekunden bei identischen Eingaben.
Vollständige Prompt-Datasets und Modell-Matrix sind auf GitHub (OttoRenner/Gentle-Coding) dokumentiert.
Theoretischer Rahmen lehnt sich an 'Gentle Parenting'-Kommunikationsprinzipien an, nicht an formale Psychologie.

Quelle lesenreddit.com

Foundation Modelle Post Training Evals Benchmarks

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Gentle Prompting statt Druck: Weniger Halluzinationen durch freundliche System-Prompts

ToolsClaude GPT Gemini Mistral Replicate

CompaniesPerplexity Mistral AI Meta AI

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Haiku 4.5 geriet unter autoritärem Prompt in eine Endlosschleife und musste manuell abgebrochen werden.
Modelle unter Condition A erfanden Zahlen wie 54 oder 97, um eine zufällige Sequenz zu vervollständigen.
Unter Gentle Framing sank die Inferenzzeit auf Sub-Sekunden bei identischen Eingaben.
Vollständige Prompt-Datasets und Modell-Matrix sind auf GitHub (OttoRenner/Gentle-Coding) dokumentiert.
Theoretischer Rahmen lehnt sich an 'Gentle Parenting'-Kommunikationsprinzipien an, nicht an formale Psychologie.

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Gentle Prompting statt Druck: Weniger Halluzinationen durch freundliche System-Prompts

Frag die KI zum Artikel

Verwandte Beiträge

Gentle Prompting statt Druck: Weniger Halluzinationen durch freundliche System-Prompts

Frag die KI zum Artikel

Verwandte Beiträge