14.06.2023

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

Eine neue Studie trübt die Hoffnungen, die in generative KI gesetzt werden. Durch zu viele KI-Inhalte im Internet könnten die Modelle verlernen, was hochwertiger Content ist.
/artikel/ki-modelle-koennen-sich-selbst-zerstoeren
Am Beispiel von blauen Katzen lässt sich erklären, wie KI-Modelle versagen. Bild: Unsplash/Rémi Rémino

Obwohl die Tech-Welt seit Jahren vor KI warnt, sind ihre Fähigkeiten erst letztes Jahr in den Fokus einer breiteren Öffentlichkeit gerückt: Generative KI ermöglicht es, mit wenigen Klicks kreative KI-Leistungen schnell verfügbar zu machen. Konkret heißt das: KI-Chatbots wie ChatGPT forumlieren auf Befehl eloquente Texte, können programmieren und verschiedene sprachliche Tasks im Nu erledigen. Bilderzeugungs-Tools wie Stable Diffusion oder Midjourney erzeugen auf Knopfdruck fotorealisitische Bilder.

Studie warnt vor Qualitätsverlust

Viele Unternehmen haben es plötzlich sehr eilig: Schnellstmöglich wollen sie KI-Lösungen in ihre Produkte implementieren, wie jüngst Mark Zuckerberg für Meta verkündete. Die Hoffnungen und Erwartungen, die in KI-Modelle gesetzt werden, sind riesig.

Die Studie eines britisch-kanadischen Forscherteams, die vor kurzem im Open-Access-Journal arXiv erschienen ist, könnte den KI-Hype jedoch etwas trüben. Sie kommt zu dem Ergebnis, dass KI-Modelle nachhaltig geschädigt werden können, wenn sie mit KI-generierten Inhalten trainieren. Denn laut den Studienautor:innen, seien die KI-Modelle derzeit vor allem deshalb so stark, weil sie mit menschengemachten Inhalten trainiert sind.

Internet als KI-Mülldeponie

„Wir waren überrascht zu sehen, wie schnell ein Modell wieder zusammenbricht. Die Modelle können die meisten Originaldaten, aus denen sie ursprünglich gelernt haben, schnell vergessen“, meinte der am Projekt beteiligte Forscher Ilia Shumailov gegenüber VentureBeat. In einem Blog-Artikel warnt Ross Anderson, ein weiterer beiteiligter Forscher: „So wie wir die Ozeane mit Plastik vermüllt und die Atmosphäre mit Kohlendioxid gefüllt haben, sind wir nun dabei, das Internet mit Blabla zu füllen. Dadurch wird es schwieriger, neuere Modelle durch Webscraping zu trainieren“.

Das Problem: Je mehr KI-Inhalte im Internet kursieren, desto weniger seien menschliche Inhalte für die KI-Modelle zum Lernen verfügbar. Anderson zufolge hätten Unternehmen, die das Internet bereits gescraped haben, bzw. die den Zugang zu menschengemachten Inhalten kontrollierten, nun immense Vorteile: „Wir sehen bereits jetzt, dass KI-Startups das Internet Archive nach historischen Daten durchsuchen“. Denn bereits jetzt sei das Netz bereits mit KI-generiertem „Müll“ kontaminiert.

Problem mit blauen Katzen

Shumailov skizziert das Problem gegenüber VentureBeat folgendermaßen: Menschengemachte Dokumente, egal ob Bilder, Texte, Musik oder andere kreative Leistungen, würden die Welt umfassender beschreiben und auch unwahrscheinlichere Fälle abbilden. KI-Modelle hingegen wählen Daten nach Wahrscheinlichkeitskriterien aus: Werden bestimmte Daten häufiger vorgefunden als andere, werden die unwahrscheinlicheren eher verworfen.

Gut zu beschreiben sei dies anhand eines Datensets aus Katzenbildern. Wird ein KI-Modell mit Bildern von 10 blauen Katzen und 90 gelben Katzen trainiert, erkennt die KI, dass gelbe Katzen mit höherer Wahrscheinlichkeit „richtig“ sind. In der Folge produziert die KI selbst grünstichige Katzenbilder, wenn sie Katzen mit blauem Fell darstellen soll. Im Laufe der Zeit produziere sie überhaupt keine blauen Katzen mehr, sondern nur mehr gelbe.

Das Beispiel zeige laut Shumailov, dass die KI-Modelle Probleme mit unwahrscheinlicheren Daten hätten. Im Laufe der Zeit würden die Modelle somit versagen, meint der Forscher. Darüber hinaus entstünden dadurch zahlreiche Probleme, etwa Diskriminierung aufgrund bestimmter Minderheiten-Eigenschaften.

Deine ungelesenen Artikel:
18.06.2026

Die nächste Finanzinfrastruktur wird gerade gebaut – die Frage ist nur, von wem

In seiner Kolumne zum „Proof of Talk“-Event in Paris zeigt Dejan Jovicevic: Blockchain wird zur neuen Finanzinfrastruktur. Europa muss jetzt handeln, um seine digitale Souveränität zu sichern.
/artikel/die-naechste-finanzinfrastruktur-wird-gerade-gebaut-die-frage-ist-nur-von-wem
18.06.2026

Die nächste Finanzinfrastruktur wird gerade gebaut – die Frage ist nur, von wem

In seiner Kolumne zum „Proof of Talk“-Event in Paris zeigt Dejan Jovicevic: Blockchain wird zur neuen Finanzinfrastruktur. Europa muss jetzt handeln, um seine digitale Souveränität zu sichern.
/artikel/die-naechste-finanzinfrastruktur-wird-gerade-gebaut-die-frage-ist-nur-von-wem
© brutkasten

Wer Blockchain hört, denkt oft noch immer an Kryptowährungen, Kursentwicklungen und die Spekulationsexzesse der vergangenen Jahre. Dieses Bild greift jedoch zunehmend zu kurz. Nach zwei Tagen beim Proof of Talk in Paris, einem der relevantesten europäischen Treffen für Web3, digitale Assets und Finanzinnovation, ist mein Eindruck vor allem einer: Die Diskussion hat sich fundamental verändert.

Bemerkenswert war dabei weniger die Technologie selbst als die Zusammensetzung der Teilnehmerinnen und Teilnehmer. Neben Gründer:innen und Technologieunternehmen waren Banken, Asset Manager, institutionelle Investoren, Zahlungsdienstleister und Regulatoren präsent. Viele der Gespräche drehten sich nicht mehr um die Frage, ob Blockchain-Technologien künftig eine Rolle spielen werden, sondern darum, wo und wie sie konkret eingesetzt werden können. Die Debatte hat die Nische verlassen und ist in der Mitte des Finanzsystems angekommen.

Genau darin liegt auch die eigentliche Relevanz der Entwicklung. Im Kern geht es längst nicht mehr um Kryptowährungen. Es geht um die Infrastruktur der Finanzwelt von morgen. Diskutiert wurden Themen wie Tokenisierung, Stablecoins, digitale Identitäten, neue Kapitalmarktmodelle und die Frage, wie Finanztransaktionen künftig abgewickelt werden. Viele dieser Entwicklungen stehen noch am Anfang. Dennoch entsteht zunehmend der Eindruck, dass sich hier grundlegende Bausteine einer neuen Finanzarchitektur herausbilden.

Besonders häufig fiel in Paris das Schlagwort Tokenisierung. Die dahinterstehende Idee ist, reale Vermögenswerte digital abzubilden und damit einfacher handelbar, teilbar und zugänglich zu machen. Befürworter sehen darin die Chance auf effizientere Kapitalmärkte und einen leichteren Zugang zu Investitionen. Ob sich diese Vision in vollem Umfang verwirklichen wird, bleibt abzuwarten. Unübersehbar ist jedoch, dass erhebliche Ressourcen und Aufmerksamkeit in diese Richtung fließen.

Für Europa stellt sich dabei eine weit größere Frage als jene nach einzelnen Technologien oder Geschäftsmodellen, nämlich die Wettbewerbsfähigkeit. In den vergangenen Jahren wurde intensiv darüber diskutiert, wie Europa bei künstlicher Intelligenz, Cloud-Infrastruktur oder Halbleitern eine stärkere Rolle einnehmen kann. Weniger Aufmerksamkeit erhält bislang die Frage, wer die Finanzinfrastruktur des digitalen Zeitalters gestaltet.

Dabei sind die Parallelen offensichtlich. Wer die Standards definiert, die Plattformen betreibt und die Infrastruktur kontrolliert, verfügt über einen erheblichen strategischen Vorteil. Wenn Europa digitale Souveränität ernst meint, sollte diese Debatte daher nicht bei KI oder Cloud-Lösungen enden. Sie muss auch den Finanzsektor umfassen.

Die Voraussetzungen dafür wären grundsätzlich vorhanden. Europa verfügt über starke Universitäten, technologisches Know-how, hohe Sparquoten und etablierte Finanzinstitutionen. Gleichzeitig zeigt sich seit Jahren ein wiederkehrendes Muster: Innovationen entstehen häufig in Europa, werden aber anderswo skaliert. Genau deshalb wird es entscheidend sein, Forschung, Unternehmertum, Kapital und Regulierung stärker zusammenzuführen und die Umsetzungsgeschwindigkeit zu erhöhen.

Proof of Talk hat mir vor allem eines vor Augen geführt: Die Diskussion befindet sich an einem anderen Punkt als noch vor wenigen Jahren. Die Frage lautet nicht mehr, ob Blockchain-Technologien jemals relevant werden könnten. Die Frage lautet zunehmend, welche konkreten Anwendungen sich durchsetzen und welche Regionen von dieser Entwicklung profitieren werden.

Ob Blockchain tatsächlich die Finanzwelt grundlegend verändern wird, kann heute niemand mit Sicherheit beantworten. Sicher ist jedoch, dass Banken, Investoren, Unternehmen und Regulatoren diese Möglichkeit mittlerweile ernsthaft diskutieren. Allein das unterscheidet die aktuelle Situation grundlegend von jener vor einigen Jahren.

Gerade deshalb lohnt es sich, die Entwicklungen aufmerksam zu verfolgen. Nicht, weil jede technologische Vision Realität wird. Sondern weil in solchen Phasen oft die Grundlagen jener Infrastrukturen entstehen, die Wirtschaft und Gesellschaft über Jahrzehnte prägen. Die nächste Finanzinfrastruktur wird möglicherweise genau jetzt gebaut. Die entscheidende Frage für Europa lautet daher nicht, ob sie kommt, sondern welche Rolle wir dabei spielen werden.

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Der Inhalt der Studie zeigt, dass KI-Modelle durch den von ihnen generierten „Müll“ selbst zerstört werden können und dass Unternehmen, die den Zugang zu menschgemachten Inhalten kontrollieren, dadurch einen Vorteil haben. Diese Erkenntnisse könnten Auswirkungen darauf haben, wie KI-Modelle trainiert werden und wer Zugang zu menschgemachten Inhalten hat, was wiederum Auswirkungen auf Wettbewerb und Diskriminierung haben könnte. Außerdem wird deutlich, dass die Vorstellung, KI könne alle Aufgaben besser lösen als Menschen, kritisch hinterfragt werden muss.

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Die Studie eines britisch-kanadischen Forscherteams, die vor kurzem im Open-Access-Journal arXiv erschienen ist, hat gezeigt, dass KI-Modelle nachhaltig geschädigt werden können, wenn sie mit KI-generierten Inhalten trainieren. Dies könnte Unternehmen, die schnell KI-Lösungen in ihre Produkte integrieren wollen, vor große Herausforderungen stellen. Das Problem besteht darin, dass je mehr KI-Inhalte im Internet verfügbar sind, desto weniger menschengemachte Inhalte für die KI-Modelle zum Lernen vorhanden sind. Unternehmen, die bereits den Zugang zu menschengemachten Inhalten kontrollieren, würden einen immensen Vorteil genießen.

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Dieser Artikel warnt Innovationsmanager:innen vor den Risiken beim Einsatz von KI-Modellen in ihren Produkten und Dienstleistungen. Eine Studie zeigt, dass KI-Modelle langfristig beschädigt werden können, wenn sie mit KI-generierten Inhalten trainiert werden, da die Modelle menschengemachte Inhalte benötigen, um weiter zu lernen. Dies kann dazu führen, dass KI-Modelle versagen und nicht mehr in der Lage sind, spezifische Daten oder Zusammenhänge richtig zu erkennen oder zu interpretieren. Innovationsmanager:innen sollten daher vorsichtig sein und sicherstellen, dass die KI-Modelle, die sie verwenden, menschengemachte Inhalte verwenden, um ihre Funktionsweise zu verbessern und langfristige Probleme zu vermeiden.

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Als Investor:in sollten Sie aufmerksam sein, wie KI-Modelle trainiert werden und welche Auswirkungen dies auf deren Qualität und Leistung hat. Die Studie zeigt, dass KI-Modelle durch den Einfluss von KI-generiertem „Müll“ dauerhaft geschädigt werden können. Daher sollten Unternehmen, die KI-basierte Lösungen entwickeln, sicherstellen, dass sie ihre Modelle mit qualitativ hochwertigen menschengemachten Inhalten trainieren, um deren Leistung und Qualität zu sichern.

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Die breite Verfügbarkeit von generativer KI hat den Hype um die Technologie verstärkt, aber eine Studie warnt nun davor, dass KI-Modelle durch ihren eigenen Müll, der in Form von KI-generierten Inhalten im Netz kursiert, nachhaltig geschädigt werden können. Die zunehmende Verbreitung von KI-generierten Inhalten führt dazu, dass die KI-Modelle weniger menschliche Inhalte für das Lernen zur Verfügung haben, und Unternehmen, die den Zugang zu menschlichem Content kontrollieren, haben daher immense Vorteile. Die Studie zeigt auch, dass die KI-Modelle Schwierigkeiten haben, unwahrscheinliche Daten abzubilden, was zu zahlreichen anderen Problemen führen kann, einschließlich Diskriminierung aufgrund von bestimmten Minderheiten-Eigenschaften.

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

  • Ilia Shumailov
  • Ross Anderson
  • Mark Zuckerberg

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

  • Meta
  • Internet Archive

Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören