10.05.2023

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

Wie AI-Sprachmodelle zu ihren Antworten kommen, bleibt häufig unklar. Ein Team von OpenAI will nun mit einem AI-Tool ChatGPT und Co erklären.
/artikel/openai-tool-soll-chatgpt-verhalten-erklaeren
ChatGPT OpenAI AI-Sprachmodell
(c) Rolf van Root / unsplash

Wie kommt ChatGPT nur darauf? Diese Frage taucht unter anderem auf, wenn das AI-Sprachmodell mal wieder völlig haarsträubende Unwahrheiten von sich gibt. Dass KI-Laien sie nicht beantworten können, verwundert nicht. Doch auch für ausgewiesene Expert:innen lässt sich das „Verhalten“ von AI-Sprachmodellen oft nicht nachvollziehen. Die Rede ist dann immer wieder von einer „Blackbox“. Doch damit will sich ein Team bei OpenAI, dem Unternehmen hinter ChatGPT, nicht zufrieden geben. Es will die vielschichtigen Wege der Künstlichen Intelligenzen (nicht nur des Sprachmodells aus dem eigenen Haus) erklären – natürlich mit einem anderen AI-Tool.

„Wollen der Antwort, die das Modell produziert, vertrauen können“

Mit diesem soll automatisch ermittelt werden, welche Teile eines AI-Sprachmodells für welche seiner „Verhaltensweisen“ verantwortlich sind. Zukünftig sollen damit immer wieder auftretende Probleme der Modelle vermieden werden. „Wir wollen damit voraussehen können, was die Probleme mit einem KI-System sein werden“, erklärt William Saunders, Leiter eines beteiligten Teams bei OpenAI, gegenüber dem US-Magazin TechCrunch. „Wir wollen letztlich wissen, dass wir dem, was das Modell tut, und der Antwort, die es produziert, vertrauen können“.

GPT-2 wird mit GPT-4 getestet

Konkret basiert das neue Tool auf dem ebenfalls von OpenAI stammenden Sprachmodell GPT-4. Getestet wird aktuell an einfacheren Modellen, vor allem am Vor-Vorgänger GPT-2 [Anm. ChatGPT basiert momentan auf GPT-3]. Dabei eruiert das Tool, welche „Neuronen“ des getesteten Modells durch einen Prompt konkret aktiviert werden. Diese „Neuronen“ sind – vereinfacht gesagt – zusammenhängende Informationen, die das Modell zu einem bestimmten Thema erlernt hat. GPT-2 hat laut den Forschern rund 300.000 davon. GPT-4 liefert dann eine Erklärung, warum diese Neuronen aktiviert wurden und wie ihr „Verhalten“ zu verstehen ist. Dazu simuliert das neuere Sprachmodell das erwartete „Verhalten“ und macht einen Abgleich.

Neues OpenAI-Tool noch im Anfangsstadium

„Mit dieser Methodik können wir für jedes einzelne Neuron eine Erklärung für das finden, was es tut, und auch eine Bewertung darüber abgeben, wie gut diese Erklärung mit dem tatsächlichen Verhalten übereinstimmt“, sagt Jeff Wu, ebenfalls OpenAI-Teamleiter, gegenüber TechCrunch. Tatsächlich waren diese Erklärungen laut Team bislang erst bei einem Bruchteil der getesteten Neuronen akkurat. Das neue Tool befinde sich aktuell noch im Anfangsstadium, wird betont. Es ist Open Source auf der Plattform Github zugänglich.

Deine ungelesenen Artikel:
28.05.2026

AI Gigafactory: Bewerbung für KI-Rechenzentrum in der Seestadt könnte kippen

2025 hat sich die Stadt Wien gemeinsam mit der Bundesregierung offiziell als Standort für eine europäische AI-Gigafactory beworben. Diese Bewerbung könnte laut einem Bericht der Tageszeitung Kurier aufgrund von geänderten Förderungsauflagen jetzt zurückgezogen werden.
/artikel/ai-gigafactory-bewerbung-fuer-ki-rechenzentrum-in-der-seestadt-koennte-kippen
28.05.2026

AI Gigafactory: Bewerbung für KI-Rechenzentrum in der Seestadt könnte kippen

2025 hat sich die Stadt Wien gemeinsam mit der Bundesregierung offiziell als Standort für eine europäische AI-Gigafactory beworben. Diese Bewerbung könnte laut einem Bericht der Tageszeitung Kurier aufgrund von geänderten Förderungsauflagen jetzt zurückgezogen werden.
/artikel/ai-gigafactory-bewerbung-fuer-ki-rechenzentrum-in-der-seestadt-koennte-kippen
Neos und epicenter.works orten Datenschutz-Skandal rund um Härtefallfonds
(c) Adobe Stock - kwarkot

In einem Interview mit brutkasten im Februar dieses Jahres hob die Wiener Digitalstadträtin Barbara Novak (SPÖ) den Standort Wien für eine „AI Gigafactory“ noch hervor. Die Abwärme der Server sollte dabei direkt in das bestehende Fernwärmenetz eingespeist werden, so das Konzept. „Bei einer AI Gigafactory fällt sehr viel Abwärme an, mit der bis zu 200.000 Haushalte versorgt werden könnten. Das wäre ein wesentlicher Beitrag zur Dekarbonisierung der Fernwärme und stellt eine klassische Win-win-Situation dar“, so Novak im Interview.

Brief von Digitalstadträtin an EU

Die Auflagen der Förderung seien von Seiten der EU nun aber dahingehend geändert worden, dass das Projekt an keinen bestimmten Standort bzw. an keine definierten Auflagen gebunden werden dürfe, berichtet die Tageszeitung Kurier. Ein zentrales Element der Wiener Bewerbung beinhaltet jedoch die erwähnte Anknüpfung der Gigafactory an das Fernwärmenetz (brutkasten berichtete). Laut Kurier wird in einem offiziellen Brief der Digitalstadträtin an die EU nun dazu aufgerufen, die Auflagen für die Förderung nochmal zu überdenken.

„Einkaufsgemeinschaften“ nicht passend für Stadt Wien

Das Finanzierungsmodell für das 5-Milliarden-Euro-Projekt sah ursprünglich vor, dass zwei Drittel der Mittel von privaten Investoren und ein Drittel gemeinschaftlich von der Stadt Wien, dem Bund sowie der EU aufgebracht werden. Aktuelle Bestrebungen in Brüssel sehen nun jedoch die Bildung von standortungebundenen „Einkaufsgemeinschaften“ vor. Für Wien würde dies bedeuten, dass das Projekt nicht mehr zwingend an die geplante Abwärme-Integration in das Fernwärmenetz gekoppelt werden dürfte. Da diese Koppelung jedoch eine Grundvoraussetzung der Wiener Bewerbung ist, wird eine Beteiligung unter den geänderten Bedingungen derzeit hinterfragt.

Fünf Gigafactories geplant

Bis zum Jahr 2028 plant die Europäische Union den Baubeginn von bis zu fünf neuen „AI-Gigafactories“. Diese hochmodernen Rechenzentren sollen speziell auf die enormen Anforderungen zugeschnitten werden, die das Training und der laufende Betrieb fortschrittlicher Künstlicher Intelligenz mit sich bringen. Dabei legt die EU besonderen Wert auf strengste Maßstäbe in den Bereichen Datensicherheit, IT-Schutz und Energieeffizienz.

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären