
Googles AI Overview scheitert an grundlegenden Rechtschreibaufgaben
Googles AI Overview, das KI-gestützte Such-Feature, macht derzeit mit simplen Rechtschreibfehlern von sich reden: Es behauptet, „Google" enthalte zwei Ps, zählt im Wort „poop" nur ein r, und buchstabiert „journalism" als j-o-u-r-n-a-d-i-s-m – sowie den Nachnamen des US-Präsidenten als t-r-p-u-m. Google räumte gegenüber TechCrunch ein: „Das Zählen innerhalb von Wörtern ist eine bekannte Herausforderung für LLMs, und wir arbeiten daran, dieses Problem zu beheben." Der Grund liegt in der Transformer-Architektur: LLMs zerlegen Text in Tokens – ganze Wörter, Silben oder Buchstaben – und übersetzen sie in numerische Repräsentationen, ohne Zeichen wie ein Mensch sequenziell zu lesen. Matthew Guzdial, KI-Forscher an der University of Alberta, erklärt: Das Modell kennt die Bedeutung von „the", aber nicht die Einzelbuchstaben T, H, E. Sheridan Feucht, Doktorandin an der Northeastern University, sieht keinen perfekten Tokenizer in Sicht. Parallel patche Google bereits einen anderen AI-Overview-Fehler, bei dem die Suche nach „disregard" statt einer Definition eine KI-Antwortphrase lieferte. Für Produkte, die auf LLMs aufbauen, illustrieren diese Fälle ein strukturelles Risiko bei zeichengenauer Textverarbeitung.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge

Googles AI Overview scheitert an grundlegenden Rechtschreibaufgaben
Googles AI Overview, das KI-gestützte Such-Feature, macht derzeit mit simplen Rechtschreibfehlern von sich reden: Es behauptet, „Google" enthalte zwei Ps, zählt im Wort „poop" nur ein r, und buchstabiert „journalism" als j-o-u-r-n-a-d-i-s-m – sowie den Nachnamen des US-Präsidenten als t-r-p-u-m. Google räumte gegenüber TechCrunch ein: „Das Zählen innerhalb von Wörtern ist eine bekannte Herausforderung für LLMs, und wir arbeiten daran, dieses Problem zu beheben." Der Grund liegt in der Transformer-Architektur: LLMs zerlegen Text in Tokens – ganze Wörter, Silben oder Buchstaben – und übersetzen sie in numerische Repräsentationen, ohne Zeichen wie ein Mensch sequenziell zu lesen. Matthew Guzdial, KI-Forscher an der University of Alberta, erklärt: Das Modell kennt die Bedeutung von „the", aber nicht die Einzelbuchstaben T, H, E. Sheridan Feucht, Doktorandin an der Northeastern University, sieht keinen perfekten Tokenizer in Sicht. Parallel patche Google bereits einen anderen AI-Overview-Fehler, bei dem die Suche nach „disregard" statt einer Definition eine KI-Antwortphrase lieferte. Für Produkte, die auf LLMs aufbauen, illustrieren diese Fälle ein strukturelles Risiko bei zeichengenauer Textverarbeitung.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.