Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

Eine neue Studie trübt die Hoffnungen, die in generative KI gesetzt werden. Durch zu viele KI-Inhalte im Internet könnten die Modelle verlernen, was hochwertiger Content ist.

/artikel/ki-modelle-koennen-sich-selbst-zerstoeren

✨ AI Kontextualisierung

Obwohl die Tech-Welt seit Jahren vor KI warnt, sind ihre Fähigkeiten erst letztes Jahr in den Fokus einer breiteren Öffentlichkeit gerückt: Generative KI ermöglicht es, mit wenigen Klicks kreative KI-Leistungen schnell verfügbar zu machen. Konkret heißt das: KI-Chatbots wie ChatGPT forumlieren auf Befehl eloquente Texte, können programmieren und verschiedene sprachliche Tasks im Nu erledigen. Bilderzeugungs-Tools wie Stable Diffusion oder Midjourney erzeugen auf Knopfdruck fotorealisitische Bilder.

Studie warnt vor Qualitätsverlust

Viele Unternehmen haben es plötzlich sehr eilig: Schnellstmöglich wollen sie KI-Lösungen in ihre Produkte implementieren, wie jüngst Mark Zuckerberg für Meta verkündete. Die Hoffnungen und Erwartungen, die in KI-Modelle gesetzt werden, sind riesig.

Die Studie eines britisch-kanadischen Forscherteams, die vor kurzem im Open-Access-Journal arXiv erschienen ist, könnte den KI-Hype jedoch etwas trüben. Sie kommt zu dem Ergebnis, dass KI-Modelle nachhaltig geschädigt werden können, wenn sie mit KI-generierten Inhalten trainieren. Denn laut den Studienautor:innen, seien die KI-Modelle derzeit vor allem deshalb so stark, weil sie mit menschengemachten Inhalten trainiert sind.

Internet als KI-Mülldeponie

„Wir waren überrascht zu sehen, wie schnell ein Modell wieder zusammenbricht. Die Modelle können die meisten Originaldaten, aus denen sie ursprünglich gelernt haben, schnell vergessen“, meinte der am Projekt beteiligte Forscher Ilia Shumailov gegenüber VentureBeat. In einem Blog-Artikel warnt Ross Anderson, ein weiterer beiteiligter Forscher: „So wie wir die Ozeane mit Plastik vermüllt und die Atmosphäre mit Kohlendioxid gefüllt haben, sind wir nun dabei, das Internet mit Blabla zu füllen. Dadurch wird es schwieriger, neuere Modelle durch Webscraping zu trainieren“.

Das Problem: Je mehr KI-Inhalte im Internet kursieren, desto weniger seien menschliche Inhalte für die KI-Modelle zum Lernen verfügbar. Anderson zufolge hätten Unternehmen, die das Internet bereits gescraped haben, bzw. die den Zugang zu menschengemachten Inhalten kontrollierten, nun immense Vorteile: „Wir sehen bereits jetzt, dass KI-Startups das Internet Archive nach historischen Daten durchsuchen“. Denn bereits jetzt sei das Netz bereits mit KI-generiertem „Müll“ kontaminiert.

Problem mit blauen Katzen

Shumailov skizziert das Problem gegenüber VentureBeat folgendermaßen: Menschengemachte Dokumente, egal ob Bilder, Texte, Musik oder andere kreative Leistungen, würden die Welt umfassender beschreiben und auch unwahrscheinlichere Fälle abbilden. KI-Modelle hingegen wählen Daten nach Wahrscheinlichkeitskriterien aus: Werden bestimmte Daten häufiger vorgefunden als andere, werden die unwahrscheinlicheren eher verworfen.

Gut zu beschreiben sei dies anhand eines Datensets aus Katzenbildern. Wird ein KI-Modell mit Bildern von 10 blauen Katzen und 90 gelben Katzen trainiert, erkennt die KI, dass gelbe Katzen mit höherer Wahrscheinlichkeit „richtig“ sind. In der Folge produziert die KI selbst grünstichige Katzenbilder, wenn sie Katzen mit blauem Fell darstellen soll. Im Laufe der Zeit produziere sie überhaupt keine blauen Katzen mehr, sondern nur mehr gelbe.

Das Beispiel zeige laut Shumailov, dass die KI-Modelle Probleme mit unwahrscheinlicheren Daten hätten. Im Laufe der Zeit würden die Modelle somit versagen, meint der Forscher. Darüber hinaus entstünden dadurch zahlreiche Probleme, etwa Diskriminierung aufgrund bestimmter Minderheiten-Eigenschaften.

Deine ungelesenen Artikel:

die Redaktion

02.06.2026

Marius Istrate wird Partner bei 3VC

Der Wiener VC-Fonds 3VC baut seine Management-Ebene aus: Der ehemalige UiPath-Personalchef und Angel-Investor Marius Istrate steigt per 2. Juni 2026 zum Partner auf.

/artikel/marius-istrate-wird-partner-bei-3vc

die Redaktion

02.06.2026

Marius Istrate wird Partner bei 3VC

Der Wiener VC-Fonds 3VC baut seine Management-Ebene aus: Der ehemalige UiPath-Personalchef und Angel-Investor Marius Istrate steigt per 2. Juni 2026 zum Partner auf.

/artikel/marius-istrate-wird-partner-bei-3vc

Seit heute hat 3VC einen neuen Partner: Marius Istrate. Der gebürtige Rumäne ist bei dem Venture-Capital-Unternehmen kein Unbekannter. Seit 2020 war er bereits als Scout und Venture Partner für den Wiener VC aktiv, wobei sein Fokus auf den Bereichen Personal, Talent und Organisationsentwicklung lag. Istrate wird laut Aussendung durch die Partner-Rolle nun tief in die Deal-Evaluierung und die Skalierung des Portfolios eingebunden.

Erfahrung aus Hypergrowth und Angel-Investments

Istrate bringt sowohl operative als auch investorenseitige Erfahrung mit. Als Chief People Officer begleitete er den Software-Konzern UiPath bis zur Pre-IPO-Phase und baute die dortigen HR-Strukturen auf. Zudem investierte er in den vergangenen sechs Jahren als Business Angel in 28 Startups in Rumänien, Ungarn, Kroatien und Estland und leitete die rumänische Angel-Gruppe TechAngels.

„In einer Zeit, in der der Wettbewerb für VC-Firmen härter wird, ist es wichtig, dort beizutragen, wo wir am stärksten sind“, sagt Istrate. Er wird weiterhin von Bukarest aus agieren. Eva Arh, Managing Partner bei 3VC, ergänzt: „Ihn voll an Bord zu haben, ist ein großer Gewinn für unsere Gründer und Investoren.“

Prominentes Portfolio – darunter Emmi AI

Das in Wien ansässige VC-Unternehmen, das anfangs unter dem Namen capital300 firmierte, verfolgt eine fokussierte Anlagestrategie in den Regionen DACH, CEE und dem Baltikum. 3VC konzentriert sich dabei primär auf ausgewählte Technologie-Startups ab der Series-A-Phase.

Ein prominentes Beispiel aus dem Portfolio ist das Linzer Startup Emmi AI, in das der Risikokapitalgeber investiert war. Die auf KI-Simulationen spezialisierte Firma sicherte sich 2025 ein Millioneninvestment und legte kürzlich einen Mega-Exit hin, als sie vom französischen KI-Unternehmen Mistral übernommen wurde. Neben Emmi AI zählen auch Unternehmen wie Storyblok und fynk zum Portfolio des Fonds.

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag