14.06.2023

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

Eine neue Studie trübt die Hoffnungen, die in generative KI gesetzt werden. Durch zu viele KI-Inhalte im Internet könnten die Modelle verlernen, was hochwertiger Content ist.
/artikel/ki-modelle-koennen-sich-selbst-zerstoeren
Am Beispiel von blauen Katzen lässt sich erklären, wie KI-Modelle versagen. Bild: Unsplash/Rémi Rémino

Obwohl die Tech-Welt seit Jahren vor KI warnt, sind ihre Fähigkeiten erst letztes Jahr in den Fokus einer breiteren Öffentlichkeit gerückt: Generative KI ermöglicht es, mit wenigen Klicks kreative KI-Leistungen schnell verfügbar zu machen. Konkret heißt das: KI-Chatbots wie ChatGPT forumlieren auf Befehl eloquente Texte, können programmieren und verschiedene sprachliche Tasks im Nu erledigen. Bilderzeugungs-Tools wie Stable Diffusion oder Midjourney erzeugen auf Knopfdruck fotorealisitische Bilder.

Studie warnt vor Qualitätsverlust

Viele Unternehmen haben es plötzlich sehr eilig: Schnellstmöglich wollen sie KI-Lösungen in ihre Produkte implementieren, wie jüngst Mark Zuckerberg für Meta verkündete. Die Hoffnungen und Erwartungen, die in KI-Modelle gesetzt werden, sind riesig.

Die Studie eines britisch-kanadischen Forscherteams, die vor kurzem im Open-Access-Journal arXiv erschienen ist, könnte den KI-Hype jedoch etwas trüben. Sie kommt zu dem Ergebnis, dass KI-Modelle nachhaltig geschädigt werden können, wenn sie mit KI-generierten Inhalten trainieren. Denn laut den Studienautor:innen, seien die KI-Modelle derzeit vor allem deshalb so stark, weil sie mit menschengemachten Inhalten trainiert sind.

Internet als KI-Mülldeponie

„Wir waren überrascht zu sehen, wie schnell ein Modell wieder zusammenbricht. Die Modelle können die meisten Originaldaten, aus denen sie ursprünglich gelernt haben, schnell vergessen“, meinte der am Projekt beteiligte Forscher Ilia Shumailov gegenüber VentureBeat. In einem Blog-Artikel warnt Ross Anderson, ein weiterer beiteiligter Forscher: „So wie wir die Ozeane mit Plastik vermüllt und die Atmosphäre mit Kohlendioxid gefüllt haben, sind wir nun dabei, das Internet mit Blabla zu füllen. Dadurch wird es schwieriger, neuere Modelle durch Webscraping zu trainieren“.

Das Problem: Je mehr KI-Inhalte im Internet kursieren, desto weniger seien menschliche Inhalte für die KI-Modelle zum Lernen verfügbar. Anderson zufolge hätten Unternehmen, die das Internet bereits gescraped haben, bzw. die den Zugang zu menschengemachten Inhalten kontrollierten, nun immense Vorteile: „Wir sehen bereits jetzt, dass KI-Startups das Internet Archive nach historischen Daten durchsuchen“. Denn bereits jetzt sei das Netz bereits mit KI-generiertem „Müll“ kontaminiert.

Problem mit blauen Katzen

Shumailov skizziert das Problem gegenüber VentureBeat folgendermaßen: Menschengemachte Dokumente, egal ob Bilder, Texte, Musik oder andere kreative Leistungen, würden die Welt umfassender beschreiben und auch unwahrscheinlichere Fälle abbilden. KI-Modelle hingegen wählen Daten nach Wahrscheinlichkeitskriterien aus: Werden bestimmte Daten häufiger vorgefunden als andere, werden die unwahrscheinlicheren eher verworfen.

Gut zu beschreiben sei dies anhand eines Datensets aus Katzenbildern. Wird ein KI-Modell mit Bildern von 10 blauen Katzen und 90 gelben Katzen trainiert, erkennt die KI, dass gelbe Katzen mit höherer Wahrscheinlichkeit „richtig“ sind. In der Folge produziert die KI selbst grünstichige Katzenbilder, wenn sie Katzen mit blauem Fell darstellen soll. Im Laufe der Zeit produziere sie überhaupt keine blauen Katzen mehr, sondern nur mehr gelbe.

Das Beispiel zeige laut Shumailov, dass die KI-Modelle Probleme mit unwahrscheinlicheren Daten hätten. Im Laufe der Zeit würden die Modelle somit versagen, meint der Forscher. Darüber hinaus entstünden dadurch zahlreiche Probleme, etwa Diskriminierung aufgrund bestimmter Minderheiten-Eigenschaften.

Deine ungelesenen Artikel:
22.06.2026

KI im Unternehmen: Von fehlenden Hausaufgaben zu “Frontier Firms” und “Avengers”

Nachlese. Im Staffelfinale von „No Hype KI“ zieht eine hochkarätig besetzte Gesprächsrunde Bilanz über den Status quo der Künstlichen Intelligenz in Österreich. Dabei zeigt sich: Während die technologische Euphorie weicht, rücken nun essenzielle Datenstrukturierungs-Prozesse, mutige Schritte in den Echtbetrieb und ein tiefgreifender kultureller Wandel in den Fokus der Unternehmen.
/artikel/ki-im-unternehmen-von-fehlenden-hausaufgaben-zu-frontier-firms-und-avengers
22.06.2026

KI im Unternehmen: Von fehlenden Hausaufgaben zu “Frontier Firms” und “Avengers”

Nachlese. Im Staffelfinale von „No Hype KI“ zieht eine hochkarätig besetzte Gesprächsrunde Bilanz über den Status quo der Künstlichen Intelligenz in Österreich. Dabei zeigt sich: Während die technologische Euphorie weicht, rücken nun essenzielle Datenstrukturierungs-Prozesse, mutige Schritte in den Echtbetrieb und ein tiefgreifender kultureller Wandel in den Fokus der Unternehmen.
/artikel/ki-im-unternehmen-von-fehlenden-hausaufgaben-zu-frontier-firms-und-avengers
vl. Patrick Ratheiser (EY), Rainer Kalkbrener (ACP), Sulejman Ganibegovic (KEBA Digital) und Hermann Erlach (Microsoft) | (c) brutkasten
vl. Patrick Ratheiser (EY), Rainer Kalkbrener (ACP), Sulejman Ganibegovic (KEBA Digital) und Hermann Erlach (Microsoft) | (c) brutkasten

„No Hype KI“ wird unterstützt von ACPEYITSVKEBA GroupLenovoMicrosoftONTEC AI und der Universität Graz.


„Die Vorstellung, dass man dank KI seine Hausaufgaben nicht machen muss, ist grundfalsch. Ganz im Gegenteil: Gerade hier ist es essenziell, bei der Datenqualität und der gesamten IT-Architektur eine saubere Basis zu schaffen“, konstatiert Rainer Kalkbrener, CEO von ACP, im Staffelfinale der brutkasten-Serie “No Hype KI”.

Mit diesem Befund ist er in der Expertenrunde nicht alleine. Der Fokus verschiebt sich von theoretischen Machbarkeiten hin zu den harten Bedingungen für echten Business Value, so der Tenor.

Österreichs Status quo und der Weg aus der Sandbox

Hermann Erlach, General Manager Austria bei Microsoft, weist auf ein aktuelles Studienergebnis hin: Österreich befindet sich bei der KI-Nutzung weltweit in den Top 20. Während Konsument:innen die Technologie im privaten Alltag bereits intensiv nutzen würden, zeige sich im Unternehmensbereich – insbesondere im Mittelstand – jedoch noch Aufholbedarf bei der Adaption. Für Patrick Ratheiser, Director & Head of AI bei EY, ist dabei klar: Der wahre geschäftliche Mehrwert liege oft nicht in hochgradig gehypten Vorzeigeprojekten. “Es sind oft die unscheinbaren Machine-Learning-Lösungen und Prozessautomatisierungen, die den Unternehmen wirklich helfen”, sagt er.

Dennoch stecken derzeit viele Initiativen noch in isolierten Experimentierphasen fest. Sulejman Ganibegovic, CEO KEBA Digital, fordert daher mehr Risikobereitschaft, um Projekte aus der geschützten Laborumgebung in den produktiven Betrieb zu überführen. Sein Appell an die Entscheidungsträger:innen: „Lieber ist man einmal mutig und wagt den Schritt aus der geschützten Laborumgebung, anstatt sich zweimal feige davor zu drücken, endlich etwas Produktives umzusetzen“. Man müsse akzeptieren, dass auch eine KI-Lösung, die nicht zu 100 Prozent fehlerfrei funktioniert, bereits einen enormen Mehrwert liefern kann.

KI als unbestechlicher Spiegel der Datenqualität

Dass dieser Weg in die erfolgreiche Produktivität zwingend über saubere Datenstrukturen führt, ist breiter Konsens in der Runde. Kalkbrener warnt, dass die KI durch ihre weitreichenden Suchkapazitäten “schonungslos die Schwächen von bestehenden Systemen aufdeckt”. Denn ohne eine funktionierende Data-Governance, so der ACP-Chef “führt das am Anfang oft zu bösen Überraschungen, wenn plötzlich intern sensible Dokumente wie Gehaltslisten oder Passwort-Dateien dank KI für weite Teile der Belegschaft auffindbar werden.”

Auch Ratheiser betont, dass der bloße Import von unstrukturierten Firmendaten in ein KI-Sprachmodell keine Wunder bewirke: „Die Arbeit, die wir seit 20 Jahren bei der Datenqualität und beim Aufräumen versäumt haben, kann jetzt nicht einfach die KI für uns lösen“.

Regulierung: Innovationsbremse oder Türöffner?

Neben der internen Datenorganisation bestimmt auch der externe Rahmen maßgeblich, wie schnell KI im Unternehmensalltag ankommt. Ein differenziertes Bild zeichnen die Experten daher bei der Debatte um den europäischen AI Act. Für Ratheiser stellt das risikobasierte Regelwerk eine notwendige Basis dar, um den breiten Rollout von Use-Cases sicher skalierbar zu machen. “Ohne klare Policies und Governance sind autonome KI-Agenten im Unternehmen auf Dauer nicht steuerbar”, so der EY-Experte. Ähnlich pragmatisch sieht das Ganibegovic aus Sicht der Industrie. Er argumentiert, dass verbindliche Spielregeln gerade bei kritischen B2B-Infrastrukturen als Türöffner fungieren: „Wenn man KI in sensiblen Bereichen einsetzen möchte, braucht es einen Rahmen, der Vertrauen schafft. Klare Gesetze untermauern dieses Vertrauen und bringen Kunden dazu, sich für neue Anwendungen zu öffnen“.

Kalkbrener hingegen äußert sich deutlich kritischer. Er warnt, dass Regulatorien oft innovationsfeindlich seien und die Geschwindigkeit im Markt drosseln würden. “Man darf nicht den Fehler machen, aus Angst vor Regulierungen alle potenziellen Probleme schon im Vorfeld lösen zu wollen”, so der CEO. Europa verliere sonst in der globalen Wirtschaft an Wettbewerbsfähigkeit.

Der kulturelle Wandel: Menschen als „Manager von Agenten“

Letztlich entfalten aber weder saubere Daten noch die besten regulatorischen Rahmenbedingungen ihre Wirkung, wenn die Belegschaft nicht mitzieht – ein Befund, der sich übrigens wie ein roter Faden durch die gesamte “No Hype KI”-Staffel zog. Die massiven Auswirkungen auf die Unternehmenskultur bilden laut den Experten den entscheidenden Hebel für die Zukunft. Erlach prognostiziert den Aufstieg sogenannter „Frontier Firms“, die KI ganz selbstverständlich neben Kapital und menschlicher Arbeitskraft als elementaren Produktionsfaktor begreifen. Der organisatorische Durchbruch gelinge dann, „wenn jeder im Unternehmen beginnt, als Manager von Agenten zu agieren und den eigenen Job mithilfe von KI zu optimieren“. Mitarbeiter:innen, die diese Tools aktiv nutzen, würden vom Management als hochproduktiv wahrgenommen, während Verweigerer an Leistungsfähigkeit dramatisch zurückfielen.

Dass dieser Wandel die Teams bereits spürbar verändert, bestätigt Ganibegovic aus der Praxis: Wenn man ein AI-natives Team mit KI-Tools ausstatte, forme man quasi ein Team von „Avengers“ mit enormer Schlagkraft, das traditionelle Entwicklungszyklen im Softwarebereich massiv verkürzen könne. Um diesen Zustand jedoch flächendeckend zu erreichen, sei ein gezieltes Befähigen der Belegschaft notwendig, meint Ratheiser. Unternehmen müssten aktiv in den Aufbau von KI-Kompetenzen (Literacy) investieren, um Berührungsängste zu minimieren und den produktiven Umgang mit den neuen Werkzeugen strategisch im Arbeitsalltag zu verankern.

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Der Inhalt der Studie zeigt, dass KI-Modelle durch den von ihnen generierten „Müll“ selbst zerstört werden können und dass Unternehmen, die den Zugang zu menschgemachten Inhalten kontrollieren, dadurch einen Vorteil haben. Diese Erkenntnisse könnten Auswirkungen darauf haben, wie KI-Modelle trainiert werden und wer Zugang zu menschgemachten Inhalten hat, was wiederum Auswirkungen auf Wettbewerb und Diskriminierung haben könnte. Außerdem wird deutlich, dass die Vorstellung, KI könne alle Aufgaben besser lösen als Menschen, kritisch hinterfragt werden muss.

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Die Studie eines britisch-kanadischen Forscherteams, die vor kurzem im Open-Access-Journal arXiv erschienen ist, hat gezeigt, dass KI-Modelle nachhaltig geschädigt werden können, wenn sie mit KI-generierten Inhalten trainieren. Dies könnte Unternehmen, die schnell KI-Lösungen in ihre Produkte integrieren wollen, vor große Herausforderungen stellen. Das Problem besteht darin, dass je mehr KI-Inhalte im Internet verfügbar sind, desto weniger menschengemachte Inhalte für die KI-Modelle zum Lernen vorhanden sind. Unternehmen, die bereits den Zugang zu menschengemachten Inhalten kontrollieren, würden einen immensen Vorteil genießen.

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Dieser Artikel warnt Innovationsmanager:innen vor den Risiken beim Einsatz von KI-Modellen in ihren Produkten und Dienstleistungen. Eine Studie zeigt, dass KI-Modelle langfristig beschädigt werden können, wenn sie mit KI-generierten Inhalten trainiert werden, da die Modelle menschengemachte Inhalte benötigen, um weiter zu lernen. Dies kann dazu führen, dass KI-Modelle versagen und nicht mehr in der Lage sind, spezifische Daten oder Zusammenhänge richtig zu erkennen oder zu interpretieren. Innovationsmanager:innen sollten daher vorsichtig sein und sicherstellen, dass die KI-Modelle, die sie verwenden, menschengemachte Inhalte verwenden, um ihre Funktionsweise zu verbessern und langfristige Probleme zu vermeiden.

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Als Investor:in sollten Sie aufmerksam sein, wie KI-Modelle trainiert werden und welche Auswirkungen dies auf deren Qualität und Leistung hat. Die Studie zeigt, dass KI-Modelle durch den Einfluss von KI-generiertem „Müll“ dauerhaft geschädigt werden können. Daher sollten Unternehmen, die KI-basierte Lösungen entwickeln, sicherstellen, dass sie ihre Modelle mit qualitativ hochwertigen menschengemachten Inhalten trainieren, um deren Leistung und Qualität zu sichern.

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Die breite Verfügbarkeit von generativer KI hat den Hype um die Technologie verstärkt, aber eine Studie warnt nun davor, dass KI-Modelle durch ihren eigenen Müll, der in Form von KI-generierten Inhalten im Netz kursiert, nachhaltig geschädigt werden können. Die zunehmende Verbreitung von KI-generierten Inhalten führt dazu, dass die KI-Modelle weniger menschliche Inhalte für das Lernen zur Verfügung haben, und Unternehmen, die den Zugang zu menschlichem Content kontrollieren, haben daher immense Vorteile. Die Studie zeigt auch, dass die KI-Modelle Schwierigkeiten haben, unwahrscheinliche Daten abzubilden, was zu zahlreichen anderen Problemen führen kann, einschließlich Diskriminierung aufgrund von bestimmten Minderheiten-Eigenschaften.

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

  • Ilia Shumailov
  • Ross Anderson
  • Mark Zuckerberg

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

  • Meta
  • Internet Archive

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören