ChatGPT erkennt Risikosignale über Gesprächsverläufe hinweg besser
OpenAI hat heute detaillierte Informationen zu Sicherheitsupdates veröffentlicht, die ChatGPT darin verbessern, Risikosignale im Gesprächsverlauf zu erkennen – sowohl innerhalb einzelner Konversationen als auch über mehrere separate Gespräche hinweg. Kern der Neuerung sind sogenannte „Safety Summaries": kurze, faktische Notizen zu sicherheitsrelevanten Inhalten aus früheren Gesprächen, die von einem speziell trainierten Sicherheitsmodell erstellt werden. Sie sind zeitlich begrenzt, eng im Scope und ausschließlich für ernste Risikosituationen gedacht – nicht für allgemeine Personalisierung oder Langzeitgedächtnis. Die Updates wurden in Zusammenarbeit mit Psychiatern und Psychologen aus OpenAIs Global Physicians Network entwickelt, darunter Experten für forensische Psychologie, Suizidprävention und Selbstverletzung. In internen Evaluierungen verbesserte sich die Rate sicherer Antworten in langen Einzelgesprächen bei Suizid- und Selbstverletzungsszenarien um 50 %, bei Harm-to-others-Szenarien um 16 %. Auf dem aktuellen Standardmodell GPT-5.5 Instant stiegen die Werte auf +52 % (Harm-to-others) bzw. +39 % (Suizid/Selbstverletzung). Die Qualität der Safety Summaries wurde in über 4.000 Evaluierungen mit durchschnittlich 4,93 von 5 Punkten für Sicherheitsrelevanz bewertet.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
ChatGPT erkennt Risikosignale über Gesprächsverläufe hinweg besser
OpenAI hat heute detaillierte Informationen zu Sicherheitsupdates veröffentlicht, die ChatGPT darin verbessern, Risikosignale im Gesprächsverlauf zu erkennen – sowohl innerhalb einzelner Konversationen als auch über mehrere separate Gespräche hinweg. Kern der Neuerung sind sogenannte „Safety Summaries": kurze, faktische Notizen zu sicherheitsrelevanten Inhalten aus früheren Gesprächen, die von einem speziell trainierten Sicherheitsmodell erstellt werden. Sie sind zeitlich begrenzt, eng im Scope und ausschließlich für ernste Risikosituationen gedacht – nicht für allgemeine Personalisierung oder Langzeitgedächtnis. Die Updates wurden in Zusammenarbeit mit Psychiatern und Psychologen aus OpenAIs Global Physicians Network entwickelt, darunter Experten für forensische Psychologie, Suizidprävention und Selbstverletzung. In internen Evaluierungen verbesserte sich die Rate sicherer Antworten in langen Einzelgesprächen bei Suizid- und Selbstverletzungsszenarien um 50 %, bei Harm-to-others-Szenarien um 16 %. Auf dem aktuellen Standardmodell GPT-5.5 Instant stiegen die Werte auf +52 % (Harm-to-others) bzw. +39 % (Suizid/Selbstverletzung). Die Qualität der Safety Summaries wurde in über 4.000 Evaluierungen mit durchschnittlich 4,93 von 5 Punkten für Sicherheitsrelevanz bewertet.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.