25.01.2023

So diskriminiert KI: ChatGPT entfacht Debatte neu

Jasmin Reisinger und Gabriele Bolek-Fügl erklären, wie Diskriminierung in der Künstlichen Intelligenz und in der KI-Branche funktionieren und was man dagegen tun könnte. Der Fall ChatGPT hat die Debatte neu entfacht.
/artikel/so-diskriminiert-ki-chatgpt-entfacht-debatte-neu
Gabriele Bolek-Fügl und Jasmin Reisinger (Women in AI Austria) sprechen über ChatGPT und Ethik in der KI © Bolek-Fügl; Reisinger; Parradee/AdobeStock
Gabriele Bolek-Fügl und Jasmin Reisinger (Women in AI Austria) sprechen über ChatGPT und Ethik in der KI © Bolek-Fügl; Reisinger; Parradee/AdobeStock

Die Kritik um ChatGPT und die Möglichkeit, rassistische oder sexistische Statements im Zuge der Nutzung zu erhalten, gibt es bereits länger. Mittlerweile hat sich die Debatte über die ethischen Aspekte der Künstlichen Intelligenz (KI) erweitert. Der Chatbot wurde soweit trainiert, dass scheinbar keine diskriminierenden Statements mehr vorkommen. Die erfolgreiche Behebung hat seinen Preis. Wie Recherchen des Time Magazins zeigen, hat die hinter ChatGPT stehende Firma OpenAI Textausschnitte an das Trainingsdatenunternehmen Sama gesendet, um die KI zu trainieren. Klickarbeiter:innen der Sama-Außenstelle in Kenia wurden dafür laut Time Magazin nicht nur mit unter zwei Dollar die Stunde für ihre Arbeit bezahlt, sondern waren mit teils traumatisierenden Inhalten konfrontiert. Um eine KI manuell zu trainieren, braucht es nämlich Menschen, die die toxischen Inhalte als solche klassifizieren und der KI übermitteln. 

Solche Skandale werfen Fragen auf: Wie können einer KI diskriminierende, sexistische und rassistische Inhalte abtrainiert werden, ohne zugleich in der realen Welt prekäre Arbeitsbedingungen zu bestärken? Im gemeinnützigen Verein “Women in Artificial Intelligence Austria” setzen sich mehrere AI-Expertinnen nicht nur mit den technologischen Aspekten, sondern auch mit der Geschlechterlücke in der Künstlichen Intelligenz auseinander. Damit widmen sie sich einer speziellen Form der Diskriminierung in der KI. Im brutkasten-Gespräch bewerten Jasmin Reisinger und Gabriele Bolek-Fügl von “Women in AI” den Fall ChatGPT und erklären die technologischen Hintergründe und was man in der Branche beachten muss, sodass gerechte Rahmenbedingungen herrschen – sowohl in der Technologie, als auch in der Realität.


Was ist Diskriminierung in der AI und wie findet sie aktuell statt?

Jasmin und Gabriele: Eine Künstliche Intelligenz lernt selbständig auf Basis von sehr vielen Datensätzen, die der Mensch bereitstellt. Diese Datensätze bilden entweder eine Momentaufnahme ab, die die bisherige Realität darstellt – inklusive der Diskriminierung von einzelnen Menschengruppen. Oder sie bilden eine Situation ab, von der umfassende Datensätze vorhanden sind. Bei zweiterem bedeutet dies, dass selten eine ausgewogene Bandbreite der Menschen in den Daten vorhanden ist. Außerdem werden die KI-Modelle von einer homogenen Gruppe von Programmierer:innen erstellt. Auch das ist eine Quelle dafür, dass sich Vorurteile in den Ergebnissen von KI-Systemen widerspiegeln.

Diskriminierung im Kontext von KI bedeutet demnach, dass Interpretationsmuster vom Menschen übernommen werden können. So können negative Diskriminierungsstrukturen entstehen. Um dies zu vermeiden, müssen Trainingsdaten “bereinigt” oder “ergänzt” werden und das ist bei Millionen von Datensätzen keine einfache Aufgabe. Vor dieser Herausforderung steht aktuell OpenAI und deren Chatbot “ChatGPT”, der für sein Können bestaunt und für seine Limitierungen kritisiert wird.

Wie beobachtet bzw. bewertet ihr diesen Sachverhalt rund um OpenAI und deren Umgang mit externen Angestellten?

Jasmin: Der Time-Artikel zu OpenAI hat bestimmte Vorgänge im Hintergrund sehr detailliert beleuchtet, die der breiten Öffentlichkeit vorher unbekannt waren. Wie bereits erwähnt ist die Bereinigung von riesigen Datensätzen eine Herausforderung, zu der es oft (noch) keine einfache Lösung gibt. Dabei sind zwei Perspektiven zu beachten: Einerseits sollte die KI-Industrie bei heiklen Datensätzen nicht auf einfache Lösungen zurückgreifen, die auf der Ausbeutung billiger Arbeitskräfte beruhen, um schnellen technologischen Fortschritt zu erreichen. Andererseits ist die Involvierung von diversen Personengruppen mit unterschiedlichen Lebensrealitäten zu begrüßen, da sie für ausgewogenere KI-Modelle stehen können.

Gabriele: Die Reaktion der Öffentlichkeit wird OpenAI langfristig dazu zwingen, ethisch unbedenkliche Wege zu finden, wie sie ihre Technologie weiterentwickeln können. Ethische Beurteilungen unterliegen immer einem gesellschaftlichen Diskurs und da stehen wir noch ganz am Anfang. Es ist jedenfalls zu begrüßen, dass die Daten von ChatGPT nach unterschiedlichen Kriterien beurteilt und bereinigt wurden. KI-Systeme anderer Hersteller mussten aufgrund von nicht ausreichend bereinigten Daten bald wieder deaktiviert werden. Ethik ist nicht einfach da. Ethische KI-Systeme bedeuten die Abbildung der gesellschaftlichen Meinung zu einem bestimmten Zeitpunkt, und diese kann sich rasch ändern. Und es bedeutet viel Arbeit, diese Meinung in tausenden Datensätzen abzubilden.

Jasmin: Ich möchte an dieser Stelle jedoch betonen, dass nicht alle KI-Systeme mit Hochrisiko-Datensätzen gefüttert werden (müssen). Die Qualitätssicherung in der Glasindustrie z.B. ist weit weg von Themen wie Rassismus oder Sexismus, und verbessert tatsächlich die Arbeitsprozesse für Arbeitnehmer:innen. Den Fall OpenAI werden wir weiterhin beobachten.

Viele Menschen vergessen bei Künstlicher Intelligenz die manuellen Aspekte – also die Content Moderation hinter der Menschen stehen, die ungefiltert mit sämtlichen Daten konfrontiert werden. Teilweise kann das auch zu einer psychischen Belastung für Arbeitnehmer:inenn führen. Wie kann man sich diese manuellen Aspekte vorstellen?

Jasmin: Um Datensätze als Basis für KI-Systeme nutzen zu können, müssen diese einem “Labeling” unterzogen werden. Der Mensch kennzeichnet dann z.B. die Merkmale einer Katze, damit die KI lernt, woran sie eine Katze erkennen oder von einem Hund unterscheiden kann.

Bei Millionen von Datensätzen muss z.B. im Falle von OpenAI gekennzeichnet werden, welche Daten diskriminierend, rassistisch, sexistisch usw. sind, um qualitativ hochwertige, wertfreie Datensätze zu erzielen. Erst dann kann die KI “gute” Ergebnisse liefern. Vor- oder Nachteile gibt es in dem Sinne nicht. Der steigende Bedarf an “Data Labeling” wird viele Unternehmen lediglich vor eine Herausforderung stellen.

Gabriele: Dass potentiell traumatisierende Informationen von Menschen angesehen werden müssen, um ein Daten Labeling für KI durchzuführen, ist der Realität geschuldet. Diese Daten wurden aus einem bestimmten Grund von Menschen erstellt. Dieser war nicht, als Trainingsdaten für eine KI herangezogen zu werden, sondern Angst, Betroffenheit oder Ähnliches bei anderen Personen zu erzeugen.

OpenAI ist nicht das erste und vermutlich nicht das letzte Unternehmen, bei dem so etwas vorkommt. Gerade in Anbetracht der Tatsache, dass wir jetzt auf einen AI-Hype blicken: Wie muss sich die AI-Branche verändern, damit solche Arbeitsbedingungen aufgehalten werden?

Gabriele: Wollen wir ethische KI-Systeme, so muss vorher ein gesellschaftlicher Diskurs zu den ethischen Werten stattfinden. Dann kann versucht werden, diese in den KI-Modellen abzubilden. Bekannt ist das Beispiel, ob ein selbstfahrendes Auto eher einen 80-jährigen Mann bei einer unausweichlichen Kollision verletzen soll oder die Mutter mit Kinderwagen.

Die Auslagerung des “Data Labeling” in andere Länder mit billigeren Kostenstrukturen und Lohn hat auch mehrere Aspekte. Aus Diversitätsgründen ist es einerseits zu begrüßen, außerdem werden so auch Arbeitsplätze mit für die Länder meist gutem Lohn geschaffen. Andererseits werden häufig jene Sachverhalte ausgelagert, die man den eigenen Angestellten nicht zumuten möchte. Das ist ethisch sicher bedenklich.

Da Millionen von Datensätzen gelabelt werden müssen, sind die KI-Unternehmen darauf angewiesen, in andere Länder auszuweichen, um die Kosten für die KI-Systeme nicht immens hoch werden zu lassen und die Arbeit parallel zur Entwicklung durchzuführen. Kosten KI-Systeme letztendlich zu viel, werden sie von nur wenigen Kund:innen genutzt. Es verzerrt den Wettbewerb noch mehr, wenn diese Methodik nur einem kleinen Benutzerkreis zur Verfügung steht, der sich hohe Kosten leisten kann.

Jasmin: Zusätzlich ist noch der geografische Aspekt zu beachten. In Europa herrscht im Gegensatz zu den USA ein Bestreben nach regulierten, vertrauenswürdigen KI-Systemen. Hier wird durchaus betont, dass sowohl in technischer als auch gesellschaftlicher Hinsicht, kein Schaden angerichtet, sondern ausschließlich positive wirtschaftliche und gesellschaftliche Beiträge geleistet werden sollen. Ein konkreter Rechtsrahmen fehlt zwar auch hier noch, aber die Richtung stimmt. Langfristig werden Länder wie die USA an Regulierungen und Leitlinien feilen müssen, wenn sie das Vertrauen der Benutzer:innen erlangen bzw. behalten wollen.

Deine ungelesenen Artikel:
17.12.2024

Austrian AI Landscape 2024: Heuer 70 neue Unternehmen

Die Austrian AI Landscape ist wieder da. Diesmal mit 70 neuen Einträgen. Clemens Wasner von EnliteAI erklärt die Gründe für die Steigerung, gibt Prognosen ab und zählt auf, was der heimische KI-Standort künftig benötigt.
/artikel/austrian-ai-landscape-2024-heuer-70-neue-unternehmen
17.12.2024

Austrian AI Landscape 2024: Heuer 70 neue Unternehmen

Die Austrian AI Landscape ist wieder da. Diesmal mit 70 neuen Einträgen. Clemens Wasner von EnliteAI erklärt die Gründe für die Steigerung, gibt Prognosen ab und zählt auf, was der heimische KI-Standort künftig benötigt.
/artikel/austrian-ai-landscape-2024-heuer-70-neue-unternehmen
AI Landscape 2024, Wasner, Hochreiter
(c) Stock.Adobe/GamePixel - Die AI Landscape 2024 ist da.

Die Austrian AI Landscape von Clemens Wasner (EnliteAI, AI Austria) zeigt AI-Startups und -Unternehmen aus der heimischen Startup-Szene. Das Branding dazu wurde von Andreas M. Keck, Kopf und Gründer von “beamr. brand consulting studio” pro-bono durchgeführt. Es ist bereits die insgesamt achte Ausgabe der österreichischen KI-Landschaft.

AI Landscape 2024 wird größer als ihre Vorgänger

“Heuer gibt es 70 neue Unternehmen, ein Novum in dieser Größenordnung. Es ist ein internationales Phänomen, denn die Eintrittsbarriere für die Gründung eines KI-Unternehmens ist gesunken. Ein Grund ist, dass viele Basistechnologien als ‘open source’ verfügbar sind und nicht mehr von Grund auf selbst entwickelt werden müssen”, erklärt Wasner die gestiegene Anzahl an KI-Unternehmen in Österreich.

Besonders im Bereich “Corporate Early Adopters” zeigt sich eine starke Steigerung. “Unternehmen, die teilweise 100 Jahre alt sind, haben eigene AI-Business-Units aufgebaut, eigene Teams zusammengestellt und sind Joint Ventures eingegangen. AI ist schlussendlich in der Realwirtschaft angekommen”, so der AI-Experte weiter.

Die AI Landscape Austria 2024

(c) EnliteAI, AI Austria, Andreas M. Keck (beamr) – Die gesamte Austrian AI Landscape.

Cybersecurity-Bereich steigt

Allgemein ist festzustellen, dass sich – entgegen der letzten Jahre – mehr Firmen mit “Cybersecurity & Defence” beschäftigen. Die Gründe dafür sind, dass es einerseits, wie erwähnt, mehr Open-Source-Modelle gibt, auf die man zurückgreifen kann, ohne selbst Basis-Modelle entwickeln zu müssen. Andererseits hat der Ukraine-Krieg ein Bewusstsein für diese Branche geschaffen.

Die EU hat etwa am 15. März 2024 das Arbeitsprogramm für den European Defence Fund veröffentlicht. Die offizielle Ausschreibung wurde am 20. Juni geöffnet, eine Einreichung war bis zum 5. November 2024 möglich. Diese Ausschreibung war mit 1,1 Milliarden Euro dotiert, wovon 40 Millionen Euro für disruptive Technologien und 67 Millionen Euro für KMU vorgesehen sind.

AI Landscape: GenAI als Treiber

Einen anderen Faktor für die Steigerung der Anzahl an KI-Firmen in Österreich sieht Wasner darin, dass viele Unternehmen in der Vergangenheit auf Automatisierung gesetzt hätten. Belege erkennen, den E-Mail-Posteingang lesen und ins CRM schieben – das sei mit der eigenen Technologie natürlich limitiert gewesen, durch Generative AI und LLMs (Large Language Models) wären nun sehr viele in diesem Bereich tätig. “Das ist etwas, das weltweit parallel passiert”, so Wasner. “Und Chatbots oder Dashboards beinhaltet.”

Auch bemerkenswert ist, dass im Bereich “Life Science” mittlerweile 30 Unternehmen aus Österreich vertreten sind. Für den KI-Experten “wenig verwunderlich”, da es hierzulande mit LISAvienna, INITS und mit dem Science Park Graz gleich drei Ökosysteme gibt, die in diesem Feld “Firmen produzieren”.

Zudem ist der Proptech-Bereich auffällig stark geworden, was wiederum an der Nutzung von LLMs liegt, zum Beispiel wenn es um die Auswertung von Dokumenten rund um Bauprojekte geht. Überall dort, wo man auf unstrukturierte Daten treffe – Baupläne, etc. – sei nun GenAI vermehrt einsatzbar und das ganze Proptech-Feld gehe “durch die Decke”. Insgesamt, so Wasner, gebe es heuer einfach mehrere große Themenfelder in der heimischen AI Landscape.

Beachtlich sei zudem, dass in der KI-Branche wenig Firmen pleite gegangen sind. “Dieses Jahr habe ich im Vergleich zum Vorjahr nur drei, vier Firmen herunternehmen müssen”, sagt er. “Davor waren es rund 30.”

Doch der KI-Experte warnt vor zu großer Euphorie. Er sieht den Moment jetzt als “Ruhe vor dem Sturm” und erwartet eine Konsolidierungswelle für das kommende Jahr. In diesem Sinne prognostiziert er einen Akquise-Trend, der uns bevorsteht. Größere Firmen würden, so seine Einschätzung, Unternehmen aus der Sparte “Operations & Search” aufkaufen, weil sich deren Angebot als replizierbares Business für Dienstleister auszeichne (Knowledge-Management, Bots, Suche mit LLMs).

Mehr Deregulierung, aber…

Was den europäischen Standort betrifft, wünscht sich Wasner mehr Deregulierung, allerdings nicht unbedingt auf der KI-Seite, wie er sagt. Europas KI-Problem liege vor allem im Umstand begründet, dass es hier schwieriger sei, zu gründen bzw. etwa Mitarbeiterbeteiligungen schwerer zu implementieren wären. “In Europa gibt es 27 Rechtsformen bei der Unternehmensgründung, das ist einfach nicht ‘investible'”, sagt er. Auch seien die Finanzierungen zu gering, vor allem dann, wenn man eine KI-Foundation baue. Mistral aus Frankreich wäre da der einzige Ausreißer, was europäische Top-KI-Firmen betreffe.

Als zweiten Punkt nennt Wasner, dass sich die “Compute-Infrastruktur” als zu klein für den europäischen Raum zeige und es von der EU-Seite Investitionen von mindestens 20 Milliarden Euro – wenn nicht mehr – bräuchte, um im KI-Konzert der Großen eine Chance zu haben. Der dritte und letzte Faktor, den Wasner in Sachen Wettbewerbsfähigkeit erwähnt, ist, auf “skilled immigration” zu setzen, um die besten Talente ins Land zu holen, wie er sagt: “Das allerdings geht nur, wenn man die ersten beiden Punkte löst.”

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

So diskriminiert KI: ChatGPT entfacht Debatte neu