23.12.2024
KÜNSTLICHE INTELLIGENZ

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

OpenAI hat ein neues Sprachmodell vorgestellt, das die Diskussionen um Artificial General Intelligence (AGI) wieder anheizt. Was steckt dahinter?
/artikel/openai-modell-o3-artifical-general-intelligence
Logo von OpenAI
Foto: Adobe Stock

Wenn OpenAI neue Dinge ankündigt, hört die KI-Szene hin. Klar, nicht jede Ankündigung des US-Unternehmens in den vergangenen zwei Jahren hatte dieselbe Tragweite wie jene vom 30. November 2022, als OpenAI den Start eines Chatbots namens ChatGPT verlautbaren ließ. Aber potenziell könnte jede Mitteilung des Unternehmens rund um CEO Sam Altman bahnbrechend sein. Kein Wunder also, dass es für Aufsehen sorgte, als OpenAI Anfang Dezember verlautbarte, zwölf Tage hintereinander neue Dinge vorzustellen.

Schon in der Ankündigung hatte Altman darauf hingewiesen, dass es neben größeren auch kleinere Neuigkeiten sein würden, die OpenAI liefern würde. So kam es dann auch: Zugang zu ChatGPT über WhatsApp oder die Integration in Apple Intelligence waren eher in die zweite Kategorie einzuordnen. Daneben veröffentlichte OpenAI aber auch das neue Modell o1 für ChatGPT – oder Sora, ein Tool zur Videoerstellung.

Den größten Widerhall in der KI-Szene fand allerdings die Ankündigung am letzten der zwölf Tage. Am vergangenen Freitagabend stellte OpenAI sein neues Modell o3 vor. Wichtig dabei: Das Modell ist noch nicht öffentlich zugänglich. OpenAI stellte zunächst einmal nur vor, wie das Modell in unterschiedlichen KI-Benchmarks abschnitt. Aber diese Ergebnisse hatten es in sich.

o3 zeigt starke Performance bei AGI-Benchmark

Vielbeachtet wurde dabei vor allem die Benchmark namens ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence), bei der zwei Varianten des o3-Modells deutlich bessere Ergebnisse erzielten als die bisher führenden o1-Modelle. Das Ziel von ARC-AGI ist es zu messen, wie sich eine KI im Umgang mit ihr unbekannten Aufgaben schlägt.

Wie die O3-Modelle verglichen mit anderen OpenAI-Modellen abschneiden // Grafik: ARC Prize

Es gibt unterschiedliche Definitionen von AGI. Die meisten davon verstehen AGI aber als ein System, das sämtliche intellektuellen Aufgaben mindestens so gut oder besser als ein Mensch erledigen kann.

Die ARC-AGI-Benchmark wurde von François Chollet konzipiert. Er definiert AGI als ein System, das “in der Lage ist, effizient neue Fähigkeiten zu erwerben und neuartige Probleme zu lösen, für die es trainiert wurde.”

Eine AGI ist also nicht für eine bestimmte Aufgabe trainiert, sondern kann jegliche Aufgaben übernehmen. Es ist weitgehender Konsens in der KI-Szene, dass solche Systeme noch nicht existieren. OpenAI wurde aber beispielsweise explizit mit dem Ziel gegründet, AGI zu erreichen.

Chollet gehört zu den bekanntesten Namen der internationalen KI-Szene. Er hat die bekannte KI-Library Keras entwickelt und seit einigen Jahren für Google tätig. Dem von ChatGPT ausgelösten Hype rund um generative KI steht Chollet seit Anfang an eher kritisch gegenüber, wie beispielsweise auch dieser brutkasten-Bericht wenige Wochen nach Erscheinen von ChatGPT thematisierte.

o3: “Wir befinden uns auf neuem Terrain”

Umso interessanter ist es, was Chollet nun zu den Ergebnissen des o3-Modells bzw. seiner Varianten zu sagen hat. In einem Blogeintrag attestiert er OpenAI, mit dem Modell einen “bedeutenden Sprung nach vorne” erreicht zu haben.

Die Performance des Modells stelle “einen echten Durchbruch” in der Anpassungsfähigkeit und Verallgemeinerung” von KI-Modellen dar”, wenn es darum gehe, wie sich KI-Modelle an neue Aufgaben anpassen könnten. o3 stelle nicht bloß einen “schrittweisen Fortschritt” dar. Vielmehr befinde man sich auf “neuem Terrain”, das “ernsthafte wissenschaftliche Aufmerksamkeit” erfordere.

Aber es ist schon Artificial General Intelligence (AGI)? Hier schränkt Chollet ein: “o3 scheitert immer noch an einigen sehr einfachen Aufgaben, was auf grundlegende Unterschiede zur menschlichen Intelligenz hinweist”. Dennoch befeuerten die Ergebnisse die Diskussion rund um AGI – und manche Stimmen sahen, anderes als Chollet, mit o3 AGI sogar bereits erreicht.

Selbst wenn dem so wäre, wäre es zum jetzigen Zeitpunkt schwer nachzuprüfen: Denn das Modell ist noch nicht veröffentlicht. Forscher:innen im Bereich der KI-Sicherheit können sich für Zugang vormerken lassen. Wann und zu welchen Konditionen das Modell für Endnutzer:innen zugänglich sein wird, ist aktuell noch unklar. Klar ist allerdings schon jetzt, dass die beeindruckenden Ergebnisse bei der ARC-AGI-Benchmark enorme Rechenressourcen erforderten – und dementsprechend teuer waren.

Reasoning-Modelle

Das o3-Modell ist eine verbesserte Version des o1-Modells, welches OpenAI am 4. Dezember veröffentliche und das zuvor bereits in Preview- und Mini-Varianten für ChatGPT-User:innen zugänglich gewesen war. Dieses Modell unterscheidet sich zu dem im Mai 2024 veröffentlichten GPT4o-Modell insofern, als es auf einen “Reasoning”-Ansatz setzt.

OpenAI bezeichnet GPT4o weiterhin als das “vielseitige, hochintelligente Flagship-Modell”, das für die “meisten Aufgaben” die richtige Wahl sei. Die o1-Modelle wiederum referenziert das Unternehmen als “Reasoning-Modelle, die sich bei komplexen, mehrstufigen Aufgaben auszeichnen”.

Enduser:innen von ChatGPT merken dies in der Nutzung vor allem insofern, als sich die o1-Modelle länger Zeit nehmen, Ergebnisse zu produzieren. Diese Modelle “verbringen mehr Zeit mit Nachdenken, bevor sie reagieren”, wie es OpenAI formuliert. In einigen (aber nicht notwendigerweise in allen) Bereichen liefern sie dann deutlich bessere Ergebnisse als die bisherigen Modelle.


Tipp der Redaktion: Die neue brutkasten-Serie “No Hype KI”

No Hype KI
Nach zwei Jahren ChatGPT liefern wir eine Bestandsaufnahme aus der österreichischen Wirtschaft – wo stehen wir wirklich?
Du willst bei "No Hype KI" am Laufenden bleiben?

Trag dich hier ein und du bekommst jede Folge direkt in die Inbox!

Deine ungelesenen Artikel:
08.01.2025

“Zusammenspiel aus Technologie und Menschlichkeit Grundlage für Erfolg”

Employee Experience, KI und mentale Gesundheit - das sind die Job-Trends für 2025, geht es nach Markus Zink, Head of Jobs bei willhaben. Er erklärt.
/artikel/zusammenspiel-aus-technologie-und-menschlichkeit-grundlage-fuer-erfolg
08.01.2025

“Zusammenspiel aus Technologie und Menschlichkeit Grundlage für Erfolg”

Employee Experience, KI und mentale Gesundheit - das sind die Job-Trends für 2025, geht es nach Markus Zink, Head of Jobs bei willhaben. Er erklärt.
/artikel/zusammenspiel-aus-technologie-und-menschlichkeit-grundlage-fuer-erfolg
Mental Health, mentale Gesundheit, willhaben
(c) willhaben - Markus Zink, Head of Jobs bei willhaben.

Für Markus Zink, Head of Jobs bei willhaben, markiert das Jahr 2025 in mancherlei Hinsicht einen Wendepunkt am österreichischen Arbeitsmarkt. Die Integration von Künstlicher Intelligenz in Human Resources-Prozesse eröffne neue Möglichkeiten für Effizienz und Innovation, bringe jedoch auch Herausforderungen mit sich. Der anhaltende Fachkräftemangel erfordere zudem nachhaltige Strategien in der Personalplanung, im Employer Branding und im Bereich der Diversität.

Attraktive Arbeitgeber:innen

Gleichzeitig würden die Bedürfnisse der Mitarbeitenden stärker in den Fokus rücken: Employee Experience, mentale Gesundheit und hybride Arbeitsmodelle spielen eine zentrale Rolle, um Unternehmen als attraktive Arbeitgeber:innen zu positionieren, heißt es.

Künstliche Intelligenz schaffte außerdem sukzessive immer mehr Möglichkeiten, um Routineaufgaben wie die Anwesenheitserfassung oder die Gehaltsabrechnung effizienter zu gestalten. KI-gestützte Tools, darunter Chatbots und Systeme für das Bewerber:innen-Management, sollen Zeit und Ressourcen sparen, die in strategische Aufgaben und den Aufbau zwischenmenschlicher Beziehungen investiert werden könnten.

Und das sei von maßgeblicher Bedeutung, denn: “Nur Unternehmen, die ethische Aspekte, Datenschutz und vor allem den Menschen in den Fokus rücken, können langfristig von diesen Entwicklungen profitieren”, sagt er.

Das Zeitalter der KI verlange allen neue Fähigkeiten ab. Führungskräfte stünden dabei in der Pflicht, Mitarbeitende gezielt zu fördern, kreative Fähigkeiten zu stärken und klare Grenzen zwischen menschlicher und maschineller Arbeit zu ziehen.

“Es gilt, Vertrauen aufzubauen, indem Unternehmen KI transparent und verantwortungsvoll einsetzen, um das Potenzial ihrer Teams bestmöglich auszuschöpfen. Dieses Zusammenspiel aus Technologie und Menschlichkeit wird 2025 die Grundlage für nachhaltigen Erfolg sein”, sagt Zink weiters.

Langfristige Personalplanung gegen Fachkräftemangel

Der vielzitierte Fachkräftemangel stellt auch 2025 eine der größten Herausforderungen am Arbeitsmarkt dar. Besonders stark betroffen sind dabei weiterhin Bereiche wie die öffentliche Sicherheit, Energiewirtschaft, das Gesundheitswesen und die Pflege, wobei in manchen Bundesländern – etwa Vorarlberg, Tirol und Salzburg – besonders händeringend nach Personal gesucht wird. Befeuert wird diese Entwicklung durch den demografischen Wandel, unzureichende Umschulungsangebote und die eher geringe Mobilität am österreichischen Arbeitsmarkt; aber auch durch fehlende Strategien, um nachhaltige Lösungen zu etablieren.

Essenziell sei hierbei unter anderem eine langfristige Personalplanung, wie Zink skizziert: “Wenn Unternehmen vorausschauend planen, statt überstürzt Stellen auszuschreiben, können sie Engpässe frühzeitig eindämmen bzw. vermeiden. Wesentlich sind außerdem Employer Branding, um das Unternehmen als attraktiven Arbeitgeber zu positionieren, zielgruppenorientierte Stellenanzeigen und die Förderung von Diversität und von Quereinsteiger:innen.”

“Nicht von der Hand zu weisen ist letztlich auch die Tatsache, dass gewisse Branchen aufgrund herausfordernder Arbeitsbedingungen und vergleichsweise niedriger Gehälter mit einem Fachkräftemangel zu kämpfen haben. Weil höhere Löhne aufgrund der schwächelnden Konjunktur oftmals schwer zu implementieren sind, plädieren Expert:innen hier für gezielte Weiterbildungsmaßnahmen im Sinne von Höherqualifizierung”, heißt es laut Aussendung.

Employee Experience

Der Begriff Employee Experience indes umfasst alle Interaktionen, Erlebnisse und Eindrücke, die Mitarbeiter:innen während ihrer Zeit im Unternehmen sammeln – von der Einstellung bis zum Austritt. Dabei handele es sich nicht nur um ein fancy Buzzword, so Zink, sondern um ein Konzept, das über kurzfristige Maßnahmen hinausgehe. Vielmehr geht es darum, langfristig ein Arbeitsumfeld zu schaffen, in dem Mitarbeitende engagiert und möglichst selbstbestimmt zur Unternehmenskultur und dem Unternehmenserfolg beitragen.

“Eine positive Employee Experience basiert auf individueller Wertschätzung und gezielten Entwicklungsmöglichkeiten. Unternehmen können dies unter anderem durch flexible Arbeitsmodelle, die Förderung von Work-Life-Balance sowie durch Programme für mentale Gesundheit priorisieren. Ein wesentlicher, jedoch oftmals vernachlässigter Baustein ist in diesem Zusammenhang vor allem eine gesunde und gelebte Feedbackkultur, in der der Austausch von konstruktivem Feedback zwischen Führungskräften, Mitarbeiter:innen und Kolleg:innen selbstverständlich ist”, gibt Zink zu bedenken.

Auch Krisen von außen – wie beispielsweise politische Konflikte, Kriege und das Stagnieren der Wirtschaft – erzeugen Druck. In Kombination mit privaten Herausforderungen, aber auch Stress, Überlastung und fehlender Wertschätzung im Beruf können die mentale Gesundheit erheblich beeinträchtigt werden. Lange galt es als Tabu, darüber am Arbeitsplatz – also ausgerechnet an jenem Ort, an dem man einen Großteil seiner Zeit verbringt – zu sprechen. Heute ist immer mehr die Rede davon, dass der Umgang mit dem Thema “Mental Health” im Berufsleben offener geworden ist.

“Das Wohlbefinden der Mitarbeiter:innen, oftmals auch als ‚Employee well-being‘ bezeichnet, umfasst drei Dimensionen: Die physische, die mentale und die finanzielle Dimension. Wie heimische Arbeitgeber:innen das Thema Mental Health handhaben, haben wir kürzlich im Rahmen einer repräsentativen Studie in Zusammenarbeit mit marketagent erörtert”, sagt Zink und ergänzt: “Dabei zeigt sich, dass mentale Gesundheit am Arbeitsplatz in Österreich zunehmend enttabuisiert wird. 68,2 Prozent der Befragten geben an, dass das Thema bei ihrem aktuellen oder letzten Arbeitgeber einen sehr hohen (28,3 Prozent) oder eher hohen Stellenwert (39,9 Prozent) hat.

2024 haben viele Unternehmen angekündigt, ihre Home-Office-Regeln zu verschärfen oder das Home-Office gar gänzlich abzuschaffen. Nichtsdestotrotz haben sich hybride Arbeitsmodelle, die Heimarbeit und Büropräsenz kombinieren, vielerorts als Norm etabliert, weiß Zink. Durch die fortschreitende Digitalisierung und das neue Telearbeitsgesetz, das in Österreich am 1.1. 2025 in Kraft getreten ist, werde die Flexibilität noch weiter ausgebaut: Mitarbeitende könnten ortsungebunden arbeiten – sei es im Co-Working-Space, bei Angehörigen oder in einer Berghütte.

“Damit einhergeht jedoch unter anderem, dass Unternehmen Maßnahmen zur Förderung des Teambuildings priorisieren müssen”, sagt Zink abschließend. “Denn diese sind in Zeiten des hybriden Arbeitens wichtiger denn je.”

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”