Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören
Eine neue Studie trübt die Hoffnungen, die in generative KI gesetzt werden. Durch zu viele KI-Inhalte im Internet könnten die Modelle verlernen, was hochwertiger Content ist.
Obwohl die Tech-Welt seit Jahren vor KI warnt, sind ihre Fähigkeiten erst letztes Jahr in den Fokus einer breiteren Öffentlichkeit gerückt: Generative KI ermöglicht es, mit wenigen Klicks kreative KI-Leistungen schnell verfügbar zu machen. Konkret heißt das: KI-Chatbots wie ChatGPT forumlieren auf Befehl eloquente Texte, können programmieren und verschiedene sprachliche Tasks im Nu erledigen. Bilderzeugungs-Tools wie Stable Diffusion oder Midjourney erzeugen auf Knopfdruck fotorealisitische Bilder.
Studie warnt vor Qualitätsverlust
Viele Unternehmen haben es plötzlich sehr eilig: Schnellstmöglich wollen sie KI-Lösungen in ihre Produkte implementieren, wie jüngst Mark Zuckerberg für Meta verkündete. Die Hoffnungen und Erwartungen, die in KI-Modelle gesetzt werden, sind riesig.
Die Studie eines britisch-kanadischen Forscherteams, die vor kurzem im Open-Access-Journal arXiv erschienen ist, könnte den KI-Hype jedoch etwas trüben. Sie kommt zu dem Ergebnis, dass KI-Modelle nachhaltig geschädigt werden können, wenn sie mit KI-generierten Inhalten trainieren. Denn laut den Studienautor:innen, seien die KI-Modelle derzeit vor allem deshalb so stark, weil sie mit menschengemachten Inhalten trainiert sind.
Internet als KI-Mülldeponie
„Wir waren überrascht zu sehen, wie schnell ein Modell wieder zusammenbricht. Die Modelle können die meisten Originaldaten, aus denen sie ursprünglich gelernt haben, schnell vergessen“, meinte der am Projekt beteiligte Forscher Ilia Shumailov gegenüber VentureBeat. In einem Blog-Artikel warnt Ross Anderson, ein weiterer beiteiligter Forscher: „So wie wir die Ozeane mit Plastik vermüllt und die Atmosphäre mit Kohlendioxid gefüllt haben, sind wir nun dabei, das Internet mit Blabla zu füllen. Dadurch wird es schwieriger, neuere Modelle durch Webscraping zu trainieren“.
Das Problem: Je mehr KI-Inhalte im Internet kursieren, desto weniger seien menschliche Inhalte für die KI-Modelle zum Lernen verfügbar. Anderson zufolge hätten Unternehmen, die das Internet bereits gescraped haben, bzw. die den Zugang zu menschengemachten Inhalten kontrollierten, nun immense Vorteile: „Wir sehen bereits jetzt, dass KI-Startups das Internet Archive nach historischen Daten durchsuchen“. Denn bereits jetzt sei das Netz bereits mit KI-generiertem „Müll“ kontaminiert.
Problem mit blauen Katzen
Shumailov skizziert das Problem gegenüber VentureBeat folgendermaßen: Menschengemachte Dokumente, egal ob Bilder, Texte, Musik oder andere kreative Leistungen, würden die Welt umfassender beschreiben und auch unwahrscheinlichere Fälle abbilden. KI-Modelle hingegen wählen Daten nach Wahrscheinlichkeitskriterien aus: Werden bestimmte Daten häufiger vorgefunden als andere, werden die unwahrscheinlicheren eher verworfen.
Gut zu beschreiben sei dies anhand eines Datensets aus Katzenbildern. Wird ein KI-Modell mit Bildern von 10 blauen Katzen und 90 gelben Katzen trainiert, erkennt die KI, dass gelbe Katzen mit höherer Wahrscheinlichkeit „richtig“ sind. In der Folge produziert die KI selbst grünstichige Katzenbilder, wenn sie Katzen mit blauem Fell darstellen soll. Im Laufe der Zeit produziere sie überhaupt keine blauen Katzen mehr, sondern nur mehr gelbe.
Das Beispiel zeige laut Shumailov, dass die KI-Modelle Probleme mit unwahrscheinlicheren Daten hätten. Im Laufe der Zeit würden die Modelle somit versagen, meint der Forscher. Darüber hinaus entstünden dadurch zahlreiche Probleme, etwa Diskriminierung aufgrund bestimmter Minderheiten-Eigenschaften.
Lehrer Harald Zumpf betreut die Hochbegabten an der HTL Spengergasse. (c) brutkasten
Dieser Text ist zuerst im brutkasten-Printmagazin von Mai 2026 „Die nächste Stufe“ erschienen. Eine Download-Möglichkeit des gesamten Magazins findet sich am Ende dieses Artikels.
Hinter einer Glasfassade in der Spengergasse befindet sich eine Schule, die mehr kann als Unterricht. Hier bauen Schüler:innen Software, die mit Produkten von Technologie-Giganten konkurriert. Wer das Gebäude betritt, sieht Klassenzimmer wie überall: Tische, Bildschirme, Schüler:innen vor ihren Laptops. Und doch entsteht hier etwas, das an vielen Schulen fehlt.
Die Liste der Absolvent:innen liest sich wie das Who’s who der österreichischen Tech-Szene: Eric Steinberger und Sebastian De Ro, deren KI-Coding-Startup Magic international für Aufsehen sorgt; Ben Koska, der mit seinen Brüdern in San Francisco an Infrastruktur für KI-Modelle arbeitet; Mojmír Horváth, der mit seinem Startup PothAI im Sommer ins Y-Combinator-Programm einzieht. Sie haben eines gemeinsam: Sie sind durch dieselbe Förderung gegangen.
Im Computerraum wartet Harald Zumpf. Er unterrichtet im Bereich Informatik – und betreut nebenbei jene, die mehr wollen als den Lehrplan. Zumpf ist seit fast 13 Jahren an der HTL Spengergasse. Als er damals an die Schule kam, fiel ihm auf, dass es zwar zahlreiche Unterstützungsangebote für schwächere Schüler:innen gab, aber kein spezielles Angebot für die leistungsstärksten. „Wir haben uns also gefragt: Wie bereiten wir die Besten möglichst gut auf die Welt nach der Schule vor?“, erzählt Zumpf. Der Lehrer suchte die Antwort direkt bei jenen, die im Unterricht herausstechen. Er fragte sie, was er für sie tun könne. So entstand nach und nach die Hochbegabtenförderung.
Heute hat sich daraus ein Programm mit 18 Schüler:innen entwickelt, die in Teams an innovativen Projekten für reale Kunden aus der Wirtschaft arbeiten. Auf dem Papier ist die Förderung ein Freifach; in der Praxis eine 24/7-Betreuung. „Alle Schüler:innen haben meine Handynummer und können sich jederzeit melden – auch am Sonntag oder in den Ferien“, sagt Zumpf. Auf LinkedIn fasst er es so zusammen: Serving Austria’s brightest minds. „Ich arbeite nicht für mich – ich arbeite für die Schüler:innen“, sagt er.
Die HTL Spengergasse im fünften Wiener Gemeindebezirk. (c) brutkasten
Erst Silicon Valley, dann Matura
Viele der Schüler:innen, die in Zumpfs Programm waren oder sind, zählen zu den vielversprechendsten Talenten in der Startup- und Innovationsszene. Der besagte Mojmír Horváth etwa, 19 Jahre alt, besucht im Rahmen eines Auslandsjahrs die renommierte Phillips Academy in den USA. Mit seinem Startup PothAI hat er es außerdem ins Early-Programm des Y-Combinator-Ökosystems geschafft. Im Sommer, gleich nach seiner Matura an der HTL Spengergasse, wird Horváth am Summer 2026 Batch teilnehmen.
Mit PothAI entwickelt er eine agentenbasierte KI, die Unternehmensdaten eigenständig analysiert, Hypothesen bildet und daraus kontinuierlich neue Erkenntnisse ableitet, um manuelle Analyseprozesse zu ersetzen. Mit drei Unternehmen sind bereits Pilotprojekte vereinbart. Wenn der YC-Batch startet, will Horváth eine funktionierende Version seines Produkts haben.
Dass er es jetzt schon so weit gebracht hat, hat er auch seiner Schule und der Hochbegabtenförderung zu verdanken. Dabei hat er aber nichts dem Zufall überlassen: „Ich habe Professor Zumpf schon vor dem Schulstart geschrieben, um herauszufinden, wie ich in das Programm komme“, erzählt Horváth. Die Förderung war einer der Gründe, warum er sich für die HTL Spengergasse entschieden hat. In die Förderung aufgenommen hat ihn Harald Zumpf in der zweiten Klasse. Ausschlaggebend war unter anderem ein Medizin-Hackathon: „Wir sind dort gegen PhD-Teams angetreten und haben den zweiten Platz erreicht, beim Publikumsvoting sogar den ersten.
In diesem Rahmen habe ich in 24 Stunden einen Deep-Learning-Algorithmus entwickelt, der Patientendaten verarbeitet und die Kostenentwicklung prognostiziert“, sagt Horváth.
Talente fallen auf
Dies ist einer von vielen Schlüsselmomenten, die Harald Zumpf mit seinen Schüler:innen erlebt. „Das Identifizieren der Hochbegabten ist das Einfachste überhaupt. Man muss sich eher Mühe geben, sie nicht zu erkennen“, sagt er. Dabei komme es auch gar nicht nur auf ihn an: „Wenn man eine Klasse fragt, wer von ihnen der Beste im Programmieren ist, zeigen alle auf dieselbe Person“, erzählt Zumpf. Auch Empfehlungen aus dem Lehrerkollegium bekommt er immer wieder.
Manchmal geht Zumpf auf die Schüler:innen zu, manchmal kommen sie zu ihm. Wer aufgenommen werden will, braucht einen bestimmten Notenschnitt, weil die schulischen Leistungen nicht leiden sollen. Kandidat:innen führen ein Gespräch mit Zumpf und zwei oder drei Schüler:innen, die bereits in der Förderung sind. „Uneinig über eine Aufnahme waren wir uns noch nie“, sagt Zumpf. Ein Assessment-Center oder andere formale Metriken gibt es nicht.
Harald Zumpf hat die Hochbegabtenförderung an der HTL Spengergasse ins Leben gerufen. (c) brutkasten
Echte Projekte statt Theorie
Was nach der Aufnahme passiert, bestimmen die Schüler:innen. In Teams von zwei bis vier Personen arbeiten sie an Themen, die sie interessieren. Dabei geht es immer um reale Projekte von Wirtschaftspartnern. „Wenn sie etwas brauchen – Mentoring, Kontakte, Rechenleistung oder Projekte –, dann organisiere ich das“, sagt Zumpf. Am Anfang des Schuljahrs stellte er Kontakt zu einer österreichischen Bank her, weil sich eines seiner Teams für Cybersecurity begeistert. Drei Tage später saßen deren Vertreter bereits in der Schule – und noch am selben Tag fiel der Startschuss für das Projekt. Mittlerweile haben die Schüler:innen eine KI für das Compliance-Management entwickelt.
„Je offener die Aufgabenstellung, desto besser. Wir arbeiten strikt agil – von Sprint zu Sprint“, sagt Zumpf. Einmal im Monat trifft er sich bei einem Jour fixe mit seinen Schüler:innen, aber wenn es Herausforderungen gibt, sieht er sie zum nächstmöglichen Termin. Den Wirtschaftspartnern verspricht Zumpf keine bestimmten Ergebnisse – die Schüler:innen sollen Fehler machen dürfen –, aber „meistens kommt etwas sehr Gutes heraus“.
Die Projekte laufen normalerweise über ein Schuljahr. Manchmal aber sind die Teams schon nach drei Wochen fertig. „Wir schauen nicht auf die Zeit – wir schauen auf das Ergebnis“, sagt Zumpf.
Von der HTL zu Y Combinator
Einer, der auch nicht auf die Zeit schaut, ist Ben Koska – zum Video-Interview erscheint er pünktlich um Mitternacht, nordamerikanische Westküstenzeit. Koska sitzt gemeinsam mit seinen Brüdern in San Francisco, um Infrastruktur für Firmen zu bauen, die KI-Modelle trainieren.
Auch er ist Absolvent der HTL Spengergasse, Maturajahrgang 2025, und war Teil des Y-Combinator-Programms, Batch 2025. Wer dort aufgenommen werden will, muss einiges vorweisen. Das konnte Koska – dank der Hochbegabtenförderung in der HTL.
„Die größte Stärke der Förderung ist die Freiheit, Dinge auszuprobieren und eigene Projekte zu verfolgen. Wir konnten an vielen Hackathons und Events teilnehmen – das wäre ohne die Unterstützung der Schule nicht möglich gewesen“, sagt Koska. Ein Highlight? „Wir haben ein akademisches Paper geschrieben und auf einer Konferenz in Dubai präsentiert – das hat mich extrem geprägt.“
In das Programm aufgenommen hat ihn Harald Zumpf, nachdem er sich bei der österreichischen Informatikolympiade für internationale Wettbewerbe qualifiziert hatte. Dass die Schule ihre jungen Talente dorthin schickt, ist Teil des Konzepts der HTL Spengergasse. „Was die HTL besonders macht, ist, dass Lehrer sagen: Wenn ihr etwas Sinnvolles macht, dann dürft ihr euch dafür Zeit nehmen“, sagt Koska.
Seine Zeit steckt Koska heute in sein Startup SF Tensor. Oft programmiert er bis spät in die Nacht – gemeinsam mit seinen Brüdern. Damit haben die drei schon früh begonnen: Noch während der Schulzeit machten sie parallel ihren Bachelor, ermöglicht durch das Programm „Schülerinnen und Schüler an die Hochschulen“ der OeAD. Der Abschluss kam damit noch vor der Matura. Ben Koska studiert heute bereits im Master Computer Science an der University of Colorado Boulder.
Seine Brüder haben inzwischen ebenfalls abgeschlossen: Ihren letzten Schultag am BG & BRG Keimgasse in Mödling hatten sie erst vor wenigen Wochen – ihre Bachelor-Abschlüsse aber schon längst in der Tasche.
Dass solche Wege kein Zufall sind, zeigt sich auch in den Rankings: In den Bestenlisten der österreichischen Informatikolympiade tauchen immer wieder Namen von Schüler:innen des BG & BRG Keimgasse und der HTL Spengergasse auf.
Ben Koska hat mit seinen Brüdern das Startup SF Tensor gegründet, an dem sie derzeit in San Francisco arbeiten. (c) San Francisco Tensor Company
Das Erfolgsrezept: Praxis und Freiraum
Was machen diese Schulen besser als alle anderen? „Das Programm selbst ist gar nicht so komplex – es ist eher die Einstellung der Lehrer:innen und der Schulleitung, die den Unterschied macht“, sagt Ben Koska. Man brauche keine komplizierten Regeln – man brauche Personen, die wirklich wollen, dass so etwas funktioniert.
PothAI-Co-Founder Mojmír Horváth sieht den Vorteil vor allem in der Praxis. „Was andere Schulen übernehmen sollten? Echte Projekte mit Unternehmen statt nur Übungsaufgaben“, sagt er. Auch dass in der Förderung nur Englisch gesprochen wird, habe ihn sehr gut auf internationale Programme wie Y Combinator vorbereitet. „Talente gibt es viele – aber erst durch die richtige Förderung kann wirklich etwas aus ihnen werden“, fasst Horváth zusammen.
Für Harald Zumpf sind mehrere Faktoren ausschlaggebend: Lehrkräfte wie er, die sich engagieren wollen, brauchen Freiraum und ein Umfeld, das unbürokratisches Vorgehen erlaubt. Starre Strukturen, feste Stundenpläne oder enge Lehrplanvorgaben stehen der Agilität, die für innovative Projekte nötig ist, oft im Weg. Wenn Lehrkräfte selbst Erfahrungen in der Wirtschaft gesammelt haben, können sie die Praxis meist besser vermitteln. Auch Zumpf ist seit 25 Jahren selbstständig tätig – nun eben neben seinem Job an der HTL. Viele der Schüler:innen im Hochbegabten-programm verdienen schon während der Schulzeit Geld als Software Engineers oder Consultants. Außerdem vernetzt Zumpf die Jugendlichen schon früh mit führenden Köpfen aus der Tech- und Startup-Szene.
Mindestens genauso wichtig ist für ihn aber das Mindset – und dazu gehört die Fehlerkultur. Zumpf spricht deshalb nie von Problemen: „Wir nennen es Herausforderungen“, sagt er. Scheitern ist trotzdem erlaubt: „Man muss wertschätzen, was gemacht wurde, und gutes Feedback geben“, sagt Zumpf.
Strukturelle Herausforderungen
So hält er es auch mit dem Programm selbst: Er schätzt, dass es die Hochbegabtenförderung gibt – aber weiß auch um deren Herausforderungen. Zum einen fehlen finanzielle Ressourcen; die Arbeit mit künstlicher Intelligenz ist kostspielig, und seitens der Schule gibt es kein Budget für die Anschaffung von Hardware. Aber Vereine und Wirtschaft unterstützen hier „schnell und unbürokratisch“, sagt Zumpf.
Offiziell ist die Hochbegabtenförderung als Freifach mit einer Wochenstunde angesetzt – entsprechend wird auch nur diese eine Stunde vergütet. Seine Schüler:innen schätzen das: „Ohne ihn geht gar nichts“, sagt SF-Tensor-Founder Ben Koska, der noch immer regelmäßig mit seinem ehemaligen HTL-Lehrer telefoniert.
Aus Talenten werden Leader
Ben Koska und Mojmír Horváth kamen als Schüler an die HTL Spengergasse – und gehen als Gründer. Eric Steinberger und Sebastian De Ro haben mit Magic ein Startup gebaut, das international Aufmerksamkeit bekommt. Wieder andere entwickeln schon vor der Matura KI-Systeme auf Produktionsniveau oder werden für Programme wie die Rise Initiative ausgewählt.
Was sie verbindet, ist weniger ein bestimmter Karriereweg als ein gemeinsamer Ausgangspunkt: eine Schule, die ihnen zutraut, mehr zu können – und ihnen den Raum gibt, es zu beweisen. Vielleicht ist das das eigentliche Erfolgsrezept der HTL Spengergasse: Nicht ein besonderes Curriculum, sondern die einfache Entscheidung, hinzuschauen – und Talente ernst zu nehmen.
Mojmír Horváth wird im Sommer im Y-Combinator-Programm sein Startup PothAI weiterentwickeln. (c) privat
Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.
Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören
AI Kontextualisierung
Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?
Der Inhalt der Studie zeigt, dass KI-Modelle durch den von ihnen generierten „Müll“ selbst zerstört werden können und dass Unternehmen, die den Zugang zu menschgemachten Inhalten kontrollieren, dadurch einen Vorteil haben. Diese Erkenntnisse könnten Auswirkungen darauf haben, wie KI-Modelle trainiert werden und wer Zugang zu menschgemachten Inhalten hat, was wiederum Auswirkungen auf Wettbewerb und Diskriminierung haben könnte. Außerdem wird deutlich, dass die Vorstellung, KI könne alle Aufgaben besser lösen als Menschen, kritisch hinterfragt werden muss.
Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören
AI Kontextualisierung
Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?
Die Studie eines britisch-kanadischen Forscherteams, die vor kurzem im Open-Access-Journal arXiv erschienen ist, hat gezeigt, dass KI-Modelle nachhaltig geschädigt werden können, wenn sie mit KI-generierten Inhalten trainieren. Dies könnte Unternehmen, die schnell KI-Lösungen in ihre Produkte integrieren wollen, vor große Herausforderungen stellen. Das Problem besteht darin, dass je mehr KI-Inhalte im Internet verfügbar sind, desto weniger menschengemachte Inhalte für die KI-Modelle zum Lernen vorhanden sind. Unternehmen, die bereits den Zugang zu menschengemachten Inhalten kontrollieren, würden einen immensen Vorteil genießen.
Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören
AI Kontextualisierung
Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?
Dieser Artikel warnt Innovationsmanager:innen vor den Risiken beim Einsatz von KI-Modellen in ihren Produkten und Dienstleistungen. Eine Studie zeigt, dass KI-Modelle langfristig beschädigt werden können, wenn sie mit KI-generierten Inhalten trainiert werden, da die Modelle menschengemachte Inhalte benötigen, um weiter zu lernen. Dies kann dazu führen, dass KI-Modelle versagen und nicht mehr in der Lage sind, spezifische Daten oder Zusammenhänge richtig zu erkennen oder zu interpretieren. Innovationsmanager:innen sollten daher vorsichtig sein und sicherstellen, dass die KI-Modelle, die sie verwenden, menschengemachte Inhalte verwenden, um ihre Funktionsweise zu verbessern und langfristige Probleme zu vermeiden.
Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören
AI Kontextualisierung
Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?
Als Investor:in sollten Sie aufmerksam sein, wie KI-Modelle trainiert werden und welche Auswirkungen dies auf deren Qualität und Leistung hat. Die Studie zeigt, dass KI-Modelle durch den Einfluss von KI-generiertem „Müll“ dauerhaft geschädigt werden können. Daher sollten Unternehmen, die KI-basierte Lösungen entwickeln, sicherstellen, dass sie ihre Modelle mit qualitativ hochwertigen menschengemachten Inhalten trainieren, um deren Leistung und Qualität zu sichern.
Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören
AI Kontextualisierung
Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?
Die breite Verfügbarkeit von generativer KI hat den Hype um die Technologie verstärkt, aber eine Studie warnt nun davor, dass KI-Modelle durch ihren eigenen Müll, der in Form von KI-generierten Inhalten im Netz kursiert, nachhaltig geschädigt werden können. Die zunehmende Verbreitung von KI-generierten Inhalten führt dazu, dass die KI-Modelle weniger menschliche Inhalte für das Lernen zur Verfügung haben, und Unternehmen, die den Zugang zu menschlichem Content kontrollieren, haben daher immense Vorteile. Die Studie zeigt auch, dass die KI-Modelle Schwierigkeiten haben, unwahrscheinliche Daten abzubilden, was zu zahlreichen anderen Problemen führen kann, einschließlich Diskriminierung aufgrund von bestimmten Minderheiten-Eigenschaften.