Studie: KI-Modelle können sich durch ihren eigenen Müll selbst zerstören

Eine neue Studie trübt die Hoffnungen, die in generative KI gesetzt werden. Durch zu viele KI-Inhalte im Internet könnten die Modelle verlernen, was hochwertiger Content ist.

/artikel/ki-modelle-koennen-sich-selbst-zerstoeren

✨ AI Kontextualisierung

Obwohl die Tech-Welt seit Jahren vor KI warnt, sind ihre Fähigkeiten erst letztes Jahr in den Fokus einer breiteren Öffentlichkeit gerückt: Generative KI ermöglicht es, mit wenigen Klicks kreative KI-Leistungen schnell verfügbar zu machen. Konkret heißt das: KI-Chatbots wie ChatGPT forumlieren auf Befehl eloquente Texte, können programmieren und verschiedene sprachliche Tasks im Nu erledigen. Bilderzeugungs-Tools wie Stable Diffusion oder Midjourney erzeugen auf Knopfdruck fotorealisitische Bilder.

Studie warnt vor Qualitätsverlust

Viele Unternehmen haben es plötzlich sehr eilig: Schnellstmöglich wollen sie KI-Lösungen in ihre Produkte implementieren, wie jüngst Mark Zuckerberg für Meta verkündete. Die Hoffnungen und Erwartungen, die in KI-Modelle gesetzt werden, sind riesig.

Die Studie eines britisch-kanadischen Forscherteams, die vor kurzem im Open-Access-Journal arXiv erschienen ist, könnte den KI-Hype jedoch etwas trüben. Sie kommt zu dem Ergebnis, dass KI-Modelle nachhaltig geschädigt werden können, wenn sie mit KI-generierten Inhalten trainieren. Denn laut den Studienautor:innen, seien die KI-Modelle derzeit vor allem deshalb so stark, weil sie mit menschengemachten Inhalten trainiert sind.

Internet als KI-Mülldeponie

„Wir waren überrascht zu sehen, wie schnell ein Modell wieder zusammenbricht. Die Modelle können die meisten Originaldaten, aus denen sie ursprünglich gelernt haben, schnell vergessen“, meinte der am Projekt beteiligte Forscher Ilia Shumailov gegenüber VentureBeat. In einem Blog-Artikel warnt Ross Anderson, ein weiterer beiteiligter Forscher: „So wie wir die Ozeane mit Plastik vermüllt und die Atmosphäre mit Kohlendioxid gefüllt haben, sind wir nun dabei, das Internet mit Blabla zu füllen. Dadurch wird es schwieriger, neuere Modelle durch Webscraping zu trainieren“.

Das Problem: Je mehr KI-Inhalte im Internet kursieren, desto weniger seien menschliche Inhalte für die KI-Modelle zum Lernen verfügbar. Anderson zufolge hätten Unternehmen, die das Internet bereits gescraped haben, bzw. die den Zugang zu menschengemachten Inhalten kontrollierten, nun immense Vorteile: „Wir sehen bereits jetzt, dass KI-Startups das Internet Archive nach historischen Daten durchsuchen“. Denn bereits jetzt sei das Netz bereits mit KI-generiertem „Müll“ kontaminiert.

Problem mit blauen Katzen

Shumailov skizziert das Problem gegenüber VentureBeat folgendermaßen: Menschengemachte Dokumente, egal ob Bilder, Texte, Musik oder andere kreative Leistungen, würden die Welt umfassender beschreiben und auch unwahrscheinlichere Fälle abbilden. KI-Modelle hingegen wählen Daten nach Wahrscheinlichkeitskriterien aus: Werden bestimmte Daten häufiger vorgefunden als andere, werden die unwahrscheinlicheren eher verworfen.

Gut zu beschreiben sei dies anhand eines Datensets aus Katzenbildern. Wird ein KI-Modell mit Bildern von 10 blauen Katzen und 90 gelben Katzen trainiert, erkennt die KI, dass gelbe Katzen mit höherer Wahrscheinlichkeit „richtig“ sind. In der Folge produziert die KI selbst grünstichige Katzenbilder, wenn sie Katzen mit blauem Fell darstellen soll. Im Laufe der Zeit produziere sie überhaupt keine blauen Katzen mehr, sondern nur mehr gelbe.

Das Beispiel zeige laut Shumailov, dass die KI-Modelle Probleme mit unwahrscheinlicheren Daten hätten. Im Laufe der Zeit würden die Modelle somit versagen, meint der Forscher. Darüber hinaus entstünden dadurch zahlreiche Probleme, etwa Diskriminierung aufgrund bestimmter Minderheiten-Eigenschaften.

Deine ungelesenen Artikel:

die Redaktion

09.07.2026

whoranks: Wiener LinkedIn-Ranking-Startup launcht „whoranks for Teams“

LinkedIn entwickelt sich für viele Unternehmen zunehmend zu einem zentralen Kanal für Sichtbarkeit, Recruiting und Vertrieb. Das Wiener Startup whoranks erweitert seine Plattform deshalb um eine Team-Lösung, mit der Unternehmen die Performance ihrer Mitarbeiter:innen auf LinkedIn analysieren, vergleichen und strategisch steuern können.

/artikel/whoranks-wiener-linkedin-ranking-startup-launcht-whoranks-for-teams

die Redaktion

09.07.2026

whoranks: Wiener LinkedIn-Ranking-Startup launcht „whoranks for Teams“

/artikel/whoranks-wiener-linkedin-ranking-startup-launcht-whoranks-for-teams

2024 von Dotbite-Co-Founder Emir Selimovic gemeinsam mit Storebox-Co-Founder Johannes Braith gestartet (brutkasten berichtete damals), ist aus dem Side-Project whoranks vergangenes Jahr eine FlexCo geworden. Anfang 2026 verkündete man einen Relaunch und ein sechsstelliges Investment. Nun folgte der Launch von „whoranks for Teams“.

whoranks: Performance analysieren

Die Plattform für messbare LinkedIn-Performance und Personal-Brand-Rankings richtet sich mit dem neuen Produkt erstmals gezielt an Unternehmen, die LinkedIn nicht länger nur als Social-Media-Kanal, sondern als strategischen Reichweiten-, Employer-Branding- und Sales-Kanal verstehen. Über whoranks for Teams können Unternehmen die LinkedIn-Performance ihrer Mitarbeiter:innen in einer gemeinsamen Ansicht analysieren, Personal Brands miteinander vergleichen, Watchlists erstellen und über Rollen- und Berechtigungsmodelle steuern, wer welche Daten sieht.

„In vielen Unternehmen entsteht die stärkste Reichweite längst nicht mehr nur über die Corporate Page, sondern über Menschen: Founder, Sales-Leader, Expertinnen, Führungskräfte oder Mitarbeitende, die konstant sichtbar sind. Genau diese Wirkung machen wir mit whoranks for Teams messbar“, sagt Emir Selimovic, Co-Founder von whoranks.

Side-by-Side-Vergleiche

Das neue Produkt bietet unter anderem Team Analytics, Side-by-Side-Vergleiche von Personal Brands, Watchlists für ausgewählte Gruppen sowie Rollen- und Rechteverwaltung. Damit sollen Unternehmen erkennen können, welche Personen tatsächlich Reichweite, Engagement und Wachstum erzeugen – und wo noch ungenutztes Potenzial liegt.

Parallel dazu öffnet whoranks zentrale Analysefunktionen für noch mehr Nutzer:innen: Performance Analytics sind ab sofort kostenlos in jedem Personal-Brand-Plan enthalten. User:innen können dadurch unter anderem verfolgen, wie sich ihr whoranks-Score über die Zeit entwickelt, wie sich Engagement-Qualität, Konsistenz und Wachstumsdynamik verändern und welche Faktoren die eigene Reichweite tatsächlich treiben. Damit möchte das Startup einen weiteren Schritt in Richtung seiner Mission setzen: LinkedIn-Performance transparenter, vergleichbarer und umsetzbar zu machen. Denn ein Score sei erst dann wirklich wertvoll, wenn Nutzer:innen verstehen, was ihn bewegt und wie sie ihre Personal Brand gezielt weiterentwickeln können.

whoranks-Ranking in Österreich & Deutschland

Zum Halbjahr zeigt auch das aktuelle „Juni-2026-Ranking Austria & Germany“ die gleiche Spitze: Mike Leber, Nana Janashia und Leila Gharani halten die Top 3 bereits den fünften Monat in Folge. Gleichzeitig zeigt das Ranking, wie eng das Feld dahinter ist: Neu in den österreichischen Top 10 ist unter anderem Sebastian Kurz, der im Juni auf Platz 5 eingestiegen ist.

In Deutschland hingegen kam wieder Bewegung in das Ranking der reichweitenstärksten LinkedIn-Persönlichkeiten. Bundeskanzler Friedrich Merz stieg neu auf Platz drei ein. Florian Palatini kehrt auf Rang sechs zurück und verfügt mit 704.751 Follower über die größte Community innerhalb der gesamten Top 10. Ebenfalls deutlich verbessern konnte sich Thomas Müller, der auf Platz zwei vorrückte. An der Spitze blieb weiterhin Carsten Maschmeyer, der seine Führungsposition behauptet und seinen Vorsprung auf einen Indexwert von 8,4 ausbaut.

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag