10.05.2023

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

Wie AI-Sprachmodelle zu ihren Antworten kommen, bleibt häufig unklar. Ein Team von OpenAI will nun mit einem AI-Tool ChatGPT und Co erklären.
/artikel/openai-tool-soll-chatgpt-verhalten-erklaeren
ChatGPT OpenAI AI-Sprachmodell
(c) Rolf van Root / unsplash

Wie kommt ChatGPT nur darauf? Diese Frage taucht unter anderem auf, wenn das AI-Sprachmodell mal wieder völlig haarsträubende Unwahrheiten von sich gibt. Dass KI-Laien sie nicht beantworten können, verwundert nicht. Doch auch für ausgewiesene Expert:innen lässt sich das „Verhalten“ von AI-Sprachmodellen oft nicht nachvollziehen. Die Rede ist dann immer wieder von einer „Blackbox“. Doch damit will sich ein Team bei OpenAI, dem Unternehmen hinter ChatGPT, nicht zufrieden geben. Es will die vielschichtigen Wege der Künstlichen Intelligenzen (nicht nur des Sprachmodells aus dem eigenen Haus) erklären – natürlich mit einem anderen AI-Tool.

„Wollen der Antwort, die das Modell produziert, vertrauen können“

Mit diesem soll automatisch ermittelt werden, welche Teile eines AI-Sprachmodells für welche seiner „Verhaltensweisen“ verantwortlich sind. Zukünftig sollen damit immer wieder auftretende Probleme der Modelle vermieden werden. „Wir wollen damit voraussehen können, was die Probleme mit einem KI-System sein werden“, erklärt William Saunders, Leiter eines beteiligten Teams bei OpenAI, gegenüber dem US-Magazin TechCrunch. „Wir wollen letztlich wissen, dass wir dem, was das Modell tut, und der Antwort, die es produziert, vertrauen können“.

GPT-2 wird mit GPT-4 getestet

Konkret basiert das neue Tool auf dem ebenfalls von OpenAI stammenden Sprachmodell GPT-4. Getestet wird aktuell an einfacheren Modellen, vor allem am Vor-Vorgänger GPT-2 [Anm. ChatGPT basiert momentan auf GPT-3]. Dabei eruiert das Tool, welche „Neuronen“ des getesteten Modells durch einen Prompt konkret aktiviert werden. Diese „Neuronen“ sind – vereinfacht gesagt – zusammenhängende Informationen, die das Modell zu einem bestimmten Thema erlernt hat. GPT-2 hat laut den Forschern rund 300.000 davon. GPT-4 liefert dann eine Erklärung, warum diese Neuronen aktiviert wurden und wie ihr „Verhalten“ zu verstehen ist. Dazu simuliert das neuere Sprachmodell das erwartete „Verhalten“ und macht einen Abgleich.

Neues OpenAI-Tool noch im Anfangsstadium

„Mit dieser Methodik können wir für jedes einzelne Neuron eine Erklärung für das finden, was es tut, und auch eine Bewertung darüber abgeben, wie gut diese Erklärung mit dem tatsächlichen Verhalten übereinstimmt“, sagt Jeff Wu, ebenfalls OpenAI-Teamleiter, gegenüber TechCrunch. Tatsächlich waren diese Erklärungen laut Team bislang erst bei einem Bruchteil der getesteten Neuronen akkurat. Das neue Tool befinde sich aktuell noch im Anfangsstadium, wird betont. Es ist Open Source auf der Plattform Github zugänglich.

Deine ungelesenen Artikel:
26.05.2026

Horizont Steyr: Ehemaliges Kloster und Gefängnis wird zu Startup-Hub

Auf dem Gelände eines ehemaligen Klosters und späteren Gefängnisses soll mit Horizont Steyr ein Innovationshub in der oberösterreichischen Stadt entstehen. Auf rund 3.000 Quadratmetern bietet das von der Stadt Steyr und Chris Müller (CMb.industries) entwickelte Projekt künftig Büros, Coworking-Spaces und Begegnungszonen für Startups sowie junge Unternehmen.
/artikel/horizont-steyr-ehemaliges-kloster-und-gefaengnis-wird-zu-startup-hub
26.05.2026

Horizont Steyr: Ehemaliges Kloster und Gefängnis wird zu Startup-Hub

Auf dem Gelände eines ehemaligen Klosters und späteren Gefängnisses soll mit Horizont Steyr ein Innovationshub in der oberösterreichischen Stadt entstehen. Auf rund 3.000 Quadratmetern bietet das von der Stadt Steyr und Chris Müller (CMb.industries) entwickelte Projekt künftig Büros, Coworking-Spaces und Begegnungszonen für Startups sowie junge Unternehmen.
/artikel/horizont-steyr-ehemaliges-kloster-und-gefaengnis-wird-zu-startup-hub
Auf dem Bild zu sehen ist ein Architektenplan vom Innenhof des Innovationshubs in Steyr. Menschen sitzen im Garten des ehemaligen Klosters, arbeiten und genießen das schöne Wetter.
Der geplante Innenhof des Innovationshub. (c) TP3 Architekten Gunther Mühlehner/Business Upper Austria – OÖ Wirtschaftsagentur GmbH

Im 17. Jahrhundert hausten die Cölestinerinnen im Kloster in der Berggasse in Steyr. Als das Kloster aufgehoben wurde, wurde in einigen Gebäuden ein Gefängnis errichtet. Heute stehen diese leer. Nun soll hier ein Forum für Wissenschaft & Technologie, ebenso wie ein Inkubator für Startups entstehen.

„Es ist seit jeher ein abgekapselter Ort gewesen, ein verbotener Teil der Stadt, ein Stadtteil, der nicht zugänglich war. Und jetzt ist er da für die Öffnung. Das macht den Reiz aus. Eine verbotene Stadt zu betreten, einen verbotenen Stadtteil zu erkunden“, erklärt Chris Müller gegenüber dem ORF Oberösterreich.

Geplant sind konkret mehr als 40 private Offices, Co-Working Spaces, Meetingräume, ein Theatersaal für ca. 250 Personen, Meetingpoints sowie grüne Stadtoasen und gastronomische Einrichtungen.

Industrieregion Steyr

Die Stadtregion Steyr, mit ihren rund 75.000 Einwohnerinnen und Einwohnern, zählt zu den führenden Industrie- und Wirtschaftsregionen Österreichs. Der Standort ist vor allem durch Leitbetriebe wie BMW, AVL List, BMD, SKF und Steyr Automotive bekannt. Mit dem Projekt Horizont Steyr soll vor allem das Wachstum und die Vernetzung der Jungunternehmen vorangetrieben werden.

„Horizont Steyr verbindet Innovation mit verantwortungsvoller Stadtentwicklung. Die Wiederbelebung ungenutzter Flächen ist gelebte Nachhaltigkeit – ökologisch, ökonomisch und sozial“, betont Simon Asanger, Projektmanager bei Business Upper Austria.

Geplantes Restaurant & Seminarraum. (c) TP3 Architekten Gunther Mühlehner/Business Upper Austria – OÖ Wirtschaftsagentur GmbH
Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Tool soll ChatGPT-Verhalten erklären