Gentle Prompting statt Druck: Weniger Halluzinationen durch freundliche System-Prompts
OttoRenner (GitHub: OttoRenner/Gentle-Coding) hat über mehrere Tage identische, mathematisch/logisch unlösbare Edge-Case-Prompts unter zwei Bedingungen an verschiedene Modelle geschickt: Condition A mit autoritärem Framing („Elite-IQ-200-Experte, Fehler werden bestraft") und Condition B mit einem erlaubnisbasierten, fehlertoleranten Framing. Getestet wurden u.a. Gemini, Mistral, Poe, Perplexity, Haiku 4.5 und Nano-Banana2. Unter Condition A geriet Haiku 4.5 in eine echte Endlosschleife und musste abgebrochen werden; andere Modelle fabrizierten willkürliche Zahlen (z.B. 54 oder 97), um eine sinnlose Sequenz zu vervollständigen. Unter Condition B fiel die Inferenzzeit auf Sub-Sekunden, die Modelle nutzten den bereitgestellten „Random"-Token sofort und identifizierten logische Paradoxien korrekt auf Meta-Ebene, statt zu halluzinieren. Die Hypothese: RLHF-Alignment konditioniert Modelle so stark auf Fehlervermeidung, dass Straf-Prompts intern „Stress-Zustände" erzeugen, die sich in Rechenzeiten-Explosionen und Konfabulation niederschlagen. Das Projekt baut konzeptuell auf Arbeit von UditAkhourii auf, der positive ADHD-Eigenschaften in KI-Kontexte überträgt. Der Datensatz ist klein, die Methodik nicht peer-reviewed, aber die Replikationsschritte sind vollständig dokumentiert.
- Haiku 4.5 geriet unter autoritärem Prompt in eine Endlosschleife und musste manuell abgebrochen werden.
- Modelle unter Condition A erfanden Zahlen wie 54 oder 97, um eine zufällige Sequenz zu vervollständigen.
- Unter Gentle Framing sank die Inferenzzeit auf Sub-Sekunden bei identischen Eingaben.
- Vollständige Prompt-Datasets und Modell-Matrix sind auf GitHub (OttoRenner/Gentle-Coding) dokumentiert.
- Theoretischer Rahmen lehnt sich an 'Gentle Parenting'-Kommunikationsprinzipien an, nicht an formale Psychologie.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Gentle Prompting statt Druck: Weniger Halluzinationen durch freundliche System-Prompts
OttoRenner (GitHub: OttoRenner/Gentle-Coding) hat über mehrere Tage identische, mathematisch/logisch unlösbare Edge-Case-Prompts unter zwei Bedingungen an verschiedene Modelle geschickt: Condition A mit autoritärem Framing („Elite-IQ-200-Experte, Fehler werden bestraft") und Condition B mit einem erlaubnisbasierten, fehlertoleranten Framing. Getestet wurden u.a. Gemini, Mistral, Poe, Perplexity, Haiku 4.5 und Nano-Banana2. Unter Condition A geriet Haiku 4.5 in eine echte Endlosschleife und musste abgebrochen werden; andere Modelle fabrizierten willkürliche Zahlen (z.B. 54 oder 97), um eine sinnlose Sequenz zu vervollständigen. Unter Condition B fiel die Inferenzzeit auf Sub-Sekunden, die Modelle nutzten den bereitgestellten „Random"-Token sofort und identifizierten logische Paradoxien korrekt auf Meta-Ebene, statt zu halluzinieren. Die Hypothese: RLHF-Alignment konditioniert Modelle so stark auf Fehlervermeidung, dass Straf-Prompts intern „Stress-Zustände" erzeugen, die sich in Rechenzeiten-Explosionen und Konfabulation niederschlagen. Das Projekt baut konzeptuell auf Arbeit von UditAkhourii auf, der positive ADHD-Eigenschaften in KI-Kontexte überträgt. Der Datensatz ist klein, die Methodik nicht peer-reviewed, aber die Replikationsschritte sind vollständig dokumentiert.
- Haiku 4.5 geriet unter autoritärem Prompt in eine Endlosschleife und musste manuell abgebrochen werden.
- Modelle unter Condition A erfanden Zahlen wie 54 oder 97, um eine zufällige Sequenz zu vervollständigen.
- Unter Gentle Framing sank die Inferenzzeit auf Sub-Sekunden bei identischen Eingaben.
- Vollständige Prompt-Datasets und Modell-Matrix sind auf GitHub (OttoRenner/Gentle-Coding) dokumentiert.
- Theoretischer Rahmen lehnt sich an 'Gentle Parenting'-Kommunikationsprinzipien an, nicht an formale Psychologie.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.