ChatGPT erkennt Risikosignale über Gesprächsverläufe hinweg besser

ToolsGPT

CompaniesOpenAI

Warum es zählt

ChatGPT speichert nun kurzfristige „Safety Summaries" aus früheren Gesprächen, um Risikosignale konversationsübergreifend zu verknüpfen – Entwickler, die ChatGPT in Krisenberatungs- oder Mental-Health-Kontexten einsetzen, müssen dieses neue Kontextgedächtnis in ihren Anwendungsdesigns berücksichtigen.

— Lumeric Redaktion

OpenAI hat heute detaillierte Informationen zu Sicherheitsupdates veröffentlicht, die ChatGPT darin verbessern, Risikosignale im Gesprächsverlauf zu erkennen – sowohl innerhalb einzelner Konversationen als auch über mehrere separate Gespräche hinweg. Kern der Neuerung sind sogenannte „Safety Summaries": kurze, faktische Notizen zu sicherheitsrelevanten Inhalten aus früheren Gesprächen, die von einem speziell trainierten Sicherheitsmodell erstellt werden. Sie sind zeitlich begrenzt, eng im Scope und ausschließlich für ernste Risikosituationen gedacht – nicht für allgemeine Personalisierung oder Langzeitgedächtnis. Die Updates wurden in Zusammenarbeit mit Psychiatern und Psychologen aus OpenAIs Global Physicians Network entwickelt, darunter Experten für forensische Psychologie, Suizidprävention und Selbstverletzung. In internen Evaluierungen verbesserte sich die Rate sicherer Antworten in langen Einzelgesprächen bei Suizid- und Selbstverletzungsszenarien um 50 %, bei Harm-to-others-Szenarien um 16 %. Auf dem aktuellen Standardmodell GPT-5.5 Instant stiegen die Werte auf +52 % (Harm-to-others) bzw. +39 % (Suizid/Selbstverletzung). Die Qualität der Safety Summaries wurde in über 4.000 Evaluierungen mit durchschnittlich 4,93 von 5 Punkten für Sicherheitsrelevanz bewertet.

Quelle lesenopenai.com

+52 % sichere Antworten

auf GPT-5.5 Instant bei Harm-to-others-Fällen

Foundation Modelle Alignment Post Training

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

ChatGPT erkennt Risikosignale über Gesprächsverläufe hinweg besser

ToolsGPT

CompaniesOpenAI

Warum es zählt

— Lumeric Redaktion

+52 % sichere Antworten

auf GPT-5.5 Instant bei Harm-to-others-Fällen

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

ChatGPT erkennt Risikosignale über Gesprächsverläufe hinweg besser

Frag die KI zum Artikel

Verwandte Beiträge

ChatGPT erkennt Risikosignale über Gesprächsverläufe hinweg besser

Frag die KI zum Artikel

Verwandte Beiträge