25.01.2023

So diskriminiert KI: ChatGPT entfacht Debatte neu

Jasmin Reisinger und Gabriele Bolek-Fügl erklären, wie Diskriminierung in der Künstlichen Intelligenz und in der KI-Branche funktionieren und was man dagegen tun könnte. Der Fall ChatGPT hat die Debatte neu entfacht.
/artikel/so-diskriminiert-ki-chatgpt-entfacht-debatte-neu
Gabriele Bolek-Fügl und Jasmin Reisinger (Women in AI Austria) sprechen über ChatGPT und Ethik in der KI © Bolek-Fügl; Reisinger; Parradee/AdobeStock
Gabriele Bolek-Fügl und Jasmin Reisinger (Women in AI Austria) sprechen über ChatGPT und Ethik in der KI © Bolek-Fügl; Reisinger; Parradee/AdobeStock

Die Kritik um ChatGPT und die Möglichkeit, rassistische oder sexistische Statements im Zuge der Nutzung zu erhalten, gibt es bereits länger. Mittlerweile hat sich die Debatte über die ethischen Aspekte der Künstlichen Intelligenz (KI) erweitert. Der Chatbot wurde soweit trainiert, dass scheinbar keine diskriminierenden Statements mehr vorkommen. Die erfolgreiche Behebung hat seinen Preis. Wie Recherchen des Time Magazins zeigen, hat die hinter ChatGPT stehende Firma OpenAI Textausschnitte an das Trainingsdatenunternehmen Sama gesendet, um die KI zu trainieren. Klickarbeiter:innen der Sama-Außenstelle in Kenia wurden dafür laut Time Magazin nicht nur mit unter zwei Dollar die Stunde für ihre Arbeit bezahlt, sondern waren mit teils traumatisierenden Inhalten konfrontiert. Um eine KI manuell zu trainieren, braucht es nämlich Menschen, die die toxischen Inhalte als solche klassifizieren und der KI übermitteln. 

Solche Skandale werfen Fragen auf: Wie können einer KI diskriminierende, sexistische und rassistische Inhalte abtrainiert werden, ohne zugleich in der realen Welt prekäre Arbeitsbedingungen zu bestärken? Im gemeinnützigen Verein “Women in Artificial Intelligence Austria” setzen sich mehrere AI-Expertinnen nicht nur mit den technologischen Aspekten, sondern auch mit der Geschlechterlücke in der Künstlichen Intelligenz auseinander. Damit widmen sie sich einer speziellen Form der Diskriminierung in der KI. Im brutkasten-Gespräch bewerten Jasmin Reisinger und Gabriele Bolek-Fügl von “Women in AI” den Fall ChatGPT und erklären die technologischen Hintergründe und was man in der Branche beachten muss, sodass gerechte Rahmenbedingungen herrschen – sowohl in der Technologie, als auch in der Realität.


Was ist Diskriminierung in der AI und wie findet sie aktuell statt?

Jasmin und Gabriele: Eine Künstliche Intelligenz lernt selbständig auf Basis von sehr vielen Datensätzen, die der Mensch bereitstellt. Diese Datensätze bilden entweder eine Momentaufnahme ab, die die bisherige Realität darstellt – inklusive der Diskriminierung von einzelnen Menschengruppen. Oder sie bilden eine Situation ab, von der umfassende Datensätze vorhanden sind. Bei zweiterem bedeutet dies, dass selten eine ausgewogene Bandbreite der Menschen in den Daten vorhanden ist. Außerdem werden die KI-Modelle von einer homogenen Gruppe von Programmierer:innen erstellt. Auch das ist eine Quelle dafür, dass sich Vorurteile in den Ergebnissen von KI-Systemen widerspiegeln.

Diskriminierung im Kontext von KI bedeutet demnach, dass Interpretationsmuster vom Menschen übernommen werden können. So können negative Diskriminierungsstrukturen entstehen. Um dies zu vermeiden, müssen Trainingsdaten “bereinigt” oder “ergänzt” werden und das ist bei Millionen von Datensätzen keine einfache Aufgabe. Vor dieser Herausforderung steht aktuell OpenAI und deren Chatbot “ChatGPT”, der für sein Können bestaunt und für seine Limitierungen kritisiert wird.

Wie beobachtet bzw. bewertet ihr diesen Sachverhalt rund um OpenAI und deren Umgang mit externen Angestellten?

Jasmin: Der Time-Artikel zu OpenAI hat bestimmte Vorgänge im Hintergrund sehr detailliert beleuchtet, die der breiten Öffentlichkeit vorher unbekannt waren. Wie bereits erwähnt ist die Bereinigung von riesigen Datensätzen eine Herausforderung, zu der es oft (noch) keine einfache Lösung gibt. Dabei sind zwei Perspektiven zu beachten: Einerseits sollte die KI-Industrie bei heiklen Datensätzen nicht auf einfache Lösungen zurückgreifen, die auf der Ausbeutung billiger Arbeitskräfte beruhen, um schnellen technologischen Fortschritt zu erreichen. Andererseits ist die Involvierung von diversen Personengruppen mit unterschiedlichen Lebensrealitäten zu begrüßen, da sie für ausgewogenere KI-Modelle stehen können.

Gabriele: Die Reaktion der Öffentlichkeit wird OpenAI langfristig dazu zwingen, ethisch unbedenkliche Wege zu finden, wie sie ihre Technologie weiterentwickeln können. Ethische Beurteilungen unterliegen immer einem gesellschaftlichen Diskurs und da stehen wir noch ganz am Anfang. Es ist jedenfalls zu begrüßen, dass die Daten von ChatGPT nach unterschiedlichen Kriterien beurteilt und bereinigt wurden. KI-Systeme anderer Hersteller mussten aufgrund von nicht ausreichend bereinigten Daten bald wieder deaktiviert werden. Ethik ist nicht einfach da. Ethische KI-Systeme bedeuten die Abbildung der gesellschaftlichen Meinung zu einem bestimmten Zeitpunkt, und diese kann sich rasch ändern. Und es bedeutet viel Arbeit, diese Meinung in tausenden Datensätzen abzubilden.

Jasmin: Ich möchte an dieser Stelle jedoch betonen, dass nicht alle KI-Systeme mit Hochrisiko-Datensätzen gefüttert werden (müssen). Die Qualitätssicherung in der Glasindustrie z.B. ist weit weg von Themen wie Rassismus oder Sexismus, und verbessert tatsächlich die Arbeitsprozesse für Arbeitnehmer:innen. Den Fall OpenAI werden wir weiterhin beobachten.

Viele Menschen vergessen bei Künstlicher Intelligenz die manuellen Aspekte – also die Content Moderation hinter der Menschen stehen, die ungefiltert mit sämtlichen Daten konfrontiert werden. Teilweise kann das auch zu einer psychischen Belastung für Arbeitnehmer:inenn führen. Wie kann man sich diese manuellen Aspekte vorstellen?

Jasmin: Um Datensätze als Basis für KI-Systeme nutzen zu können, müssen diese einem “Labeling” unterzogen werden. Der Mensch kennzeichnet dann z.B. die Merkmale einer Katze, damit die KI lernt, woran sie eine Katze erkennen oder von einem Hund unterscheiden kann.

Bei Millionen von Datensätzen muss z.B. im Falle von OpenAI gekennzeichnet werden, welche Daten diskriminierend, rassistisch, sexistisch usw. sind, um qualitativ hochwertige, wertfreie Datensätze zu erzielen. Erst dann kann die KI “gute” Ergebnisse liefern. Vor- oder Nachteile gibt es in dem Sinne nicht. Der steigende Bedarf an “Data Labeling” wird viele Unternehmen lediglich vor eine Herausforderung stellen.

Gabriele: Dass potentiell traumatisierende Informationen von Menschen angesehen werden müssen, um ein Daten Labeling für KI durchzuführen, ist der Realität geschuldet. Diese Daten wurden aus einem bestimmten Grund von Menschen erstellt. Dieser war nicht, als Trainingsdaten für eine KI herangezogen zu werden, sondern Angst, Betroffenheit oder Ähnliches bei anderen Personen zu erzeugen.

OpenAI ist nicht das erste und vermutlich nicht das letzte Unternehmen, bei dem so etwas vorkommt. Gerade in Anbetracht der Tatsache, dass wir jetzt auf einen AI-Hype blicken: Wie muss sich die AI-Branche verändern, damit solche Arbeitsbedingungen aufgehalten werden?

Gabriele: Wollen wir ethische KI-Systeme, so muss vorher ein gesellschaftlicher Diskurs zu den ethischen Werten stattfinden. Dann kann versucht werden, diese in den KI-Modellen abzubilden. Bekannt ist das Beispiel, ob ein selbstfahrendes Auto eher einen 80-jährigen Mann bei einer unausweichlichen Kollision verletzen soll oder die Mutter mit Kinderwagen.

Die Auslagerung des “Data Labeling” in andere Länder mit billigeren Kostenstrukturen und Lohn hat auch mehrere Aspekte. Aus Diversitätsgründen ist es einerseits zu begrüßen, außerdem werden so auch Arbeitsplätze mit für die Länder meist gutem Lohn geschaffen. Andererseits werden häufig jene Sachverhalte ausgelagert, die man den eigenen Angestellten nicht zumuten möchte. Das ist ethisch sicher bedenklich.

Da Millionen von Datensätzen gelabelt werden müssen, sind die KI-Unternehmen darauf angewiesen, in andere Länder auszuweichen, um die Kosten für die KI-Systeme nicht immens hoch werden zu lassen und die Arbeit parallel zur Entwicklung durchzuführen. Kosten KI-Systeme letztendlich zu viel, werden sie von nur wenigen Kund:innen genutzt. Es verzerrt den Wettbewerb noch mehr, wenn diese Methodik nur einem kleinen Benutzerkreis zur Verfügung steht, der sich hohe Kosten leisten kann.

Jasmin: Zusätzlich ist noch der geografische Aspekt zu beachten. In Europa herrscht im Gegensatz zu den USA ein Bestreben nach regulierten, vertrauenswürdigen KI-Systemen. Hier wird durchaus betont, dass sowohl in technischer als auch gesellschaftlicher Hinsicht, kein Schaden angerichtet, sondern ausschließlich positive wirtschaftliche und gesellschaftliche Beiträge geleistet werden sollen. Ein konkreter Rechtsrahmen fehlt zwar auch hier noch, aber die Richtung stimmt. Langfristig werden Länder wie die USA an Regulierungen und Leitlinien feilen müssen, wenn sie das Vertrauen der Benutzer:innen erlangen bzw. behalten wollen.

Deine ungelesenen Artikel:
17.12.2024

AnyConcept: Wie ein Grazer Software-Testing-Startup Google verblüffte

AnyConcept aus Graz hat eine Software Testautomatisierungs-Lösung entwickelt und dabei beim Trainieren seiner KI Google auf sich aufmerksam gemacht. Wie genau das Modell funktioniert und was der US-Gigant wollte, erklären die Gründer Leander Zaiser, Manuel Weichselbaum und Markus Hauser.
/artikel/anyconcept-wie-ein-grazer-software-testing-startup-google-verblueffte
17.12.2024

AnyConcept: Wie ein Grazer Software-Testing-Startup Google verblüffte

AnyConcept aus Graz hat eine Software Testautomatisierungs-Lösung entwickelt und dabei beim Trainieren seiner KI Google auf sich aufmerksam gemacht. Wie genau das Modell funktioniert und was der US-Gigant wollte, erklären die Gründer Leander Zaiser, Manuel Weichselbaum und Markus Hauser.
/artikel/anyconcept-wie-ein-grazer-software-testing-startup-google-verblueffte
Anyconcept, AnyConcept, Automatiserung, Software testen,
(c) AnyConcept - Das AnyConcept-Team.

Rund 80 Prozent aller Unternehmen testen ihre Anwendungen und Software händisch. Entweder klicken sie sich mühsam durch ihre Software oder ihren Webshop, um zu sehen, was funktioniert und was nicht, oder sie coden sich ihre Tests. Beides langwierige, kostenintensive und mühsame Aufgaben. Das wissen Leander Zaiser, CEO, Manuel Weichselbaum, CTO, und Markus Hauser, die gemeinsam mit Kevin Intering und Pascal Goldschmied das KI-Startup AnyConcept gegründet haben.

AnyConcept und das Problem der No-code-Software

Die Founder haben sich deswegen dazu entschlossen eine Testautomatisierungs-Software zu entwickeln, um den Prozess für Unternehmen zu vereinfachen und günstiger zu gestalten.

Zaiser war sechs Jahre lang RPA-Experte (Robotics Process Automation) bei Raiffeisen und hat dort Automatisierungssoftware automatisiert. Der CEO musste dabei feststellen, dass vermeintliche No-code-Software ohne Entwicklungskompetenzen sich nicht erfolgreich einsetzen ließ. Für gelernte Softwareentwickler wiederum war das Arbeiten mit solch einer Anwendung keine attraktive Tätigkeit.

Weichselbaum indes forscht seitdem er 17 ist an Künstlicher Intelligenz. Und widmet sich dabei vor allem immer den aktuellen Herausforderungen der internationalen Forschung. Das passte hervorragend zu Zaisers erkanntem Problem: aktuelle Automatisierungssoftware ist zu komplex für Non-Coder und nicht attraktiv genug für Coder. Also fragten sich die Founder: Was, wenn man Automatisierung mit einem No-Code-Ansatz macht, mithilfe einer KI, die genau das tut, was man ihr auf dem Bildschirm zeigt? So war AnyConcept geboren.

Das Black Friday-Problem

“Jede Software, jeder Webshop, jede Applikation muss immer wieder getestet werden, ob sie richtig funktioniert. Und da sie auch ständig durch neue Updates von Entwicklern oder bei einem Webshop mit neuen Produkten gefüttert wird, verändern sich Applikationen dauerhaft. Das kann wieder zum Brechen der bisherigen Funktionen führen”, erklärt Hauser, ein per Eigendefinition fleischgewordenes Startup-Kind, das zuletzt Johannes Braith (Storebox) als rechte Hand begleiten und somit Entrepreneurship aus nächster Nähe beobachten und Mitwirken durfte.

Der Gründer präzisiert sein Argument mit einem Beispiel passend zum Black Friday. Jedes Jahr würden Unternehmen Milliarden US-Dollar verlieren, weil sie ihre Preise falsch definieren oder Prozente und Dollar verwechseln, ohne dass es wem auffällt. Außerdem könnten “Trilliarden US-Dollar” an Schäden durch fehlerhafter Software, die nicht richtig getestet wurde, vermieden und “50 Prozent der IT-Projektkosten” gesenkt werden, wenn Testen automatisiert mit No-Code abläuft, so seine Überzeugung.

“Durch unser KI-Modell, das ein User-Interface rein durch Pixeldaten, Mausklicks und Tastatureingaben erkennen und manövrieren kann, schaffen wir es Automatisierung No-Code zu gestalten”, sagt Hauser. “Das Ziel ist es unsere KI-Agenten zukünftig zum Beispiel einen Prozess wie UI-Software-Testing rein durch eine Demonstration, das bedeutet das Vorzeigen des Testfalles, automatisiert durchführen zu lassen. Sie werden sich dabei exakt so verhalten wie es ein Benutzer tun würde, orientieren sich nur an den Elementen des User-Interface und konzentrieren sich nicht auf den dahinterliegenden Code. Das ist unser USP.”

FUSE for Machine Learning

Dieses Alleinstellungsmerkmal fiel auch Google auf. Konkreter Google Cloud Storage FUSE for Machine Learning. Anfänglich noch ein Open Source-Produkt als “Linux Filesystem in Userspace” oder eben als “FUSE” tituliert, wurde die Software von Google in die Cloud integriert und hilft beim Verwalten von Unmengen von Trainingsdaten, Modellen und Kontrollpunkten, die man zum Trainieren und Bereitstellen von KI-Workloads benötigt.

Anwendungen können hierbei direkt auf die Cloud zugreifen (Anm.: anstatt sie lokal herunterzuladen); als wären sie lokal gespeichert. Es müssten zudem keine benutzerdefinierte Logik implementiert werden und es gebe weniger Leerlaufzeit für wertvolle Ressourcen wie TPUs und GPUs, während die Daten übertragen werden.

FUSE sei einfach ein Produkt für Unternehmen, so Weichselbaum weiter, um große Datenmengen bequem zu verwalten und sie verfügbar zu machen: “Wir verwenden es, um viele Terrabytes von Daten auf der Cloud zu lagern, was am Computer nicht möglich ist”, sagt er.

Google sagt Hallo

Weil AnyConcept das Service von FUSE sehr intensiv nutzte, wurde Google auf die Grazer aufmerksam. Und hat konkret nachgefragt, was sie für einen Use-Case mit ihrem Angebot entwickelt haben. “Wir waren einer der ersten, die das genutzt haben, um effizient unsere KI-Agents zu trainieren“, sagt Weichselbaum. “Das Produkt von Google ist ein Teil unserer Datenverarbeitung und des Trainings unserer ganz spezifischen KI und Google wollte wissen, warum und wie wir das so intensiv verwenden. Das hat dazu geführt, dass wir unsere Ideen für Produktverbesserungen und Skripts mit ihnen teilen durften.“

AnyConcept und seine Konzepte

Das Ziel von AnyConcept ist es, ein Foundation-Modell nicht für Texte oder Bilder, sondern für Interaktionen mit dem User-Interface zu entwickeln.

Im Detail reicht hierbei eine Demonstration von einem solchen Interface und AnyConcept analysiert es mit neuronalen Netzwerken. Es erkennt Strukturen, die das Startup seinem Namen getreu “Konzepte” nennt und die auf breites Wissen aufbauen, wie man mit einem Computer interagiert.

“So ein Konzept wäre etwa ein ‘Button’ auf einer Website”, erklärt es Zaiser in anderen Worten. “Die KI versteht dann, dass man ihn anklicken kann und was danach passiert. Oder wie lange eine Website braucht, sich zu öffnen und wie sie aussieht.”

Aktuell forscht AnyConcept an der Generalisierungsfähigkeit ihres Netzwerkes. Zaiser dazu: “Wir testen unsere KI bereits mit Pilotkunden bei der Anwendung von Software-Testautomatisierung und bekommen großartiges Feedback.”

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu