Benchmark: Auslassungen 43× häufiger als Halluzinationen bei KI-Arztnotizen
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org2d
NOHARM-Benchmark misst klinische Sicherheit von LLMs in der Medizin
- FORSCHUNGarxiv.org1w
AI-MASLD: Stress-Audit zeigt Sicherheitslücken klinischer LLMs jenseits von Benchmarks
- FORSCHUNGarxiv.org2d
Multi-Agenten-Framework reduziert Diagnosefehler in medizinischen LLM-Anwendungen
- FORSCHUNGarxiv.org2w
IatroBench: AI-Sicherheitsfilter schaden Patienten durch selektives Informationsvorenthalten
Benchmark: Auslassungen 43× häufiger als Halluzinationen bei KI-Arztnotizen
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org2d
NOHARM-Benchmark misst klinische Sicherheit von LLMs in der Medizin
- FORSCHUNGarxiv.org1w
AI-MASLD: Stress-Audit zeigt Sicherheitslücken klinischer LLMs jenseits von Benchmarks
- FORSCHUNGarxiv.org2d
Multi-Agenten-Framework reduziert Diagnosefehler in medizinischen LLM-Anwendungen
- FORSCHUNGarxiv.org2w
IatroBench: AI-Sicherheitsfilter schaden Patienten durch selektives Informationsvorenthalten