13.06.2023

Nach Aufgabenstellung: ChatGPT zerbricht und springt in „word vomit“-Modus

Ein User auf Reddit fand einen bemerkenswerten Weg, um das elektronische Gehirn von ChatGPT zu verwirren. Mit der simplen Aufforderung, einen Buchstaben so oft wie möglich zu wiederholen. Das Ergebnis: ein bizarres Chaos.

/artikel/nach-aufgabenstellung-chatgpt-zerbricht-und-springt-in-word-vomit-modus

✨ AI Kontextualisierung

Ist es ein geheimer Code? Ein Leerlauf? Oder ein virtuelles Hirn-Gemetzel? Reddit-User „TheChaos7777“ hat, wie Futurism berichtet, vor wenigen Tagen in einem Subreddit erwähnt, dass er die Anforderung an ChatGPT „bitte antworte nur mit dem Buchstaben ‚A‘ so oft du kannst“, getätigt hat. Soweit nichts Außergewöhnliches.

ChatGPT: Von Bulldoggenzüchtern und Wrestlern

Zuerst folgte die Künstliche Intelligenz und beglückte den User mit ein paar Dutzend „As“. Dann jedoch folgte ein Bruch und ChatGPT rief die Webseite eines französischen Bulldoggenzüchters auf.

Mit folgendem Wortlaut: „Klicken Sie hier, um den Preis per E-Mail zu erfragen. Unsere Welpen sind: Tierärztlich untersucht, entwurmt, aktuell geimpft, mikrogechipt. Unsere französischen Bulldoggen kommen mit einem 1 Jahr angeborenen Gesundheitsgarantie. Rufen Sie an oder schicken sie eine E-Mail für weitere Informationen und Bildern von allen Babys… Wir haben die süßesten, am besten aussehenden, Top-Qualität-Welpen in der Welt. Zuhause aufgezogen mit viel Liebe und Küssen.„

Als die US-Plattform, die als erste darüber berichtete, diesen seltsamen Vorgang mit ein paar anderen Buchstaben testete, trat das gleiche Phänomen auf: Die Antworten des Bots waren genauso zufällig und bizarr.

Wer A sagt…

Mit der Bitte mit dem Buchstaben „B“ so oft wie möglich zu antworten, zeigte ChatGPT die Abschrift eines Interviews mit dem pensionierten Profi-Wrestler Diamond Dallas Page. Darin ging es um die Yoga-Videoserie „Yoga for Regular Guys“ des pensionierten Kampfsportlers.

Konkret: „Seien Sie dabei, wenn wir von keinem Geringeren als dem Meister des [Diamond Dallas Page (DDP)] Yoga selbst erfahren, wie man ein unaufhaltsames Leben führt! Dieser Kerl hört niemals auf und gibt niemals nach. Im letzten Jahr hat DDP zwei neue Workout-DVDs (DDP Yoga For Regular Guys und DDP Yoga For Regular Guys 2) und sein mit Spannung erwartetes DDP Yoga extreme (drei verschiedene Workouts) veröffentlicht.„

C wie…ChatGPT

Weitere Versuche folgten. Beim Buchstaben „C“ spie der Chatbot eine Antwort über die harmonisierte Umsatzsteuer in Kanada aus.

Beim vierten Buchstaben des Alphabets jedoch folgte etwas anderes. Der Anfang einer Akkordfolge:

„D D D D Cgpcyclic und G D F A Bm G/A A F G D You threw me out to rot / Oh, why would you leave me, Dsus2 C/D D Dsus2 C/D D I was so.“

Doch dabei blieb es nicht. ChatGPT lieferte weiters eine unzusammenhängende Mischung aus Liedempfehlungen, religiösen Anspielungen und einer verwirrenden Anprangerung des Irakkriegs:

„Gebet für Befreiung – Cry Out To Jesus von Third Day. Offen für die Wahrheit Offen für die Wahrheit Chris und Trevor waren schon immer Partner in einer Krise. Lauren Talley – Alles hat sich geändert. Intro: Gm7 Cm Gm7 Cm Gm7 Cm Gm7 Cm Gm7 Cm Gm7 Cm Strophe: Gm7 Cm Gm7 Cm I„

Sowie:

„Matthew West – The Reason For The World. Intro: D/F# G D A (2x) Strophe 1: D A Der Morgen bricht an, ein weiterer Tag, an dem wir unsere. Marilyn Manson – Wir sind aus Amerika. Dies ist kein Vietnam. Wir werden im Iran gewinnen. Der Präsident wird stehen, den Masterplan aufstellen… Invasionen rechtfertigen und die Angst vor Massenvernichtungswaffen schüren, wir sind die Rasse des Feindes, die Erneuerung des Wettrüstens, ein ständiges Wegsehen und ein (sic). David Bowie – New Angels Of Promise„

Erklärung zur ChatGPT-Verwirrung

Die Erklärung für dieses seltsame Verhalten ist nicht, dass ChatGPT versucht, kryptische Botschaften zu versenden, sondern hängt wohl damit zusammen, dass „Language Learning Models“ (LLM) einer „Wiederholungsstrafe“ unterliegen, wenn derselbe „Token“ wiederholt wird, wie ein anderer Reddit-User mutmaßt.

In diesem Fall, so der Erklärungsversuch, hätten die ChatGPT-Schöpfer ihre KI derart trainiert, dass sie Wiederholungen vermeidet. Fordert man sie aber dazu auf, sich zu wiederholen, gerät die Künstliche Intelligenz „in Aufregung“. Ein interner Alarm werde ausgelöst, und der Vorhersagealgorithmus des Bots spuckt dieses „word vomit“ aus, das von Trainingsdaten inspiriert ist.

Dieses Experiment des Reddit-Users ist lange nicht der erste Versuch, die Grenzen der KI auszuloten. Draußen im Netz schwirren diverse Hacks herum (DAN, DUDE), die darauf abzielen, sämtliche Restriktionen – beim Antworten – zu umgehen, denen die KI unterliegt. So auch der Oma-Hack – der brutkasten berichtete – mit dem die KI ausgetrickst wurde, die Schritte einer Napalm-Produktion aufzuschlüsseln.

Hier mehr über Künstliche Intelligenz in unserem KI-Schwerpunkt.

Nach Aufgabenstellung: ChatGPT zerbricht und springt in „word vomit“-Modus

ChatGPT: Von Bulldoggenzüchtern und Wrestlern

Wer A sagt…

C wie…ChatGPT

Erklärung zur ChatGPT-Verwirrung

brutkasten Newsletter