Wenn es um die populärsten Tools im Arbeitsalltag der Startup-Szene geht, dürfte ChatGPT jedenfalls im Spitzenfeld liegen. Insofern ist die für den gestrigen Montag angesetzte Produktankündigung von OpenAI durchaus mit Spannung erwartet worden. Im Vorfeld hatte das Unternehmen nur angekündigt, dass es “manche ChatGTP- und GPT4-Updates” vorstellen würde. Tatsächlich präsentierte OpenAI dann ein neues “Flagship-Modell”, wie sie es selbst bezeichneten: GPT-4o. Das kleine “o” im Namen des Modells steht dabei für “omni”.

Das Sprachmodelle biete “eine Intelligenz auf GPT-4-Niveau”, sei aber “viel schneller” und sei besser im Umgang mit “Text, Audio und Video”, kündigte OpenAI dabei an. Die auffälligste Verbesserung: Die Spracheingabe. Auf dieser lag auch der Schwerpunkt der Präsentation am Montag, bei der OpenAI-Mitarbeiter:innen sich mit der KI direkt unterhielten und fließende Gespräche führen konnten. Das Modell wird aktuell ausgerollt und war am Dienstag auch bereits für User:innen in Österreich verfügbar.

Echtzeit-Videodialoge mit ChatGPT geplant

Nach Angaben von OpenAI ist GPT-4o auch besser als jedes bisherige Modell darin, Bilder zu verstehen. Als Beispiel nennt das Unternehmen Speisekarten in anderen Sprachen: Mit GPT-4o könne man ein Bild hochladen und sich dann mit dem Modell per Spracheingabe unterhalten, um etwas über die angebotenen Speisen zu erfahren oder auch Empfehlungen zu erhalten.

Weitere Updates sollen es ermöglichen, sich mit ChatGPT in Echtzeit per Video zu unterhalten. GPT-4o kann auch im Coding eingesetzt werden – etwa, indem man Code in die Kamera hält und das Sprachmodell diesen erläutert. Analog dazu könnte das Modell auch beim Erklären von Mathematik-Aufgaben verwendet werden.

GPT-4o nicht nur in Bezahlversion

Eine Überraschung gab es business-seitig: Denn das neue Modell soll auch Gratis-Nutzer:innen von ChatGPT zugänglich gemacht werden. Bisher war das im März 2023 vorgestellte GPT-4-Modell nur für zahlende Kund:innen zugänglich. Nutzer:innen der Gratis-Version stand nur das schwächere Modell GPT-3.5 zur Verfügung.

Dies ändert sich nun. Zahlende User:innen erhalten jedoch höhere Nutzungs-Limits. Entwickler:innen, die GPT-4o über eine Programmierschnittstelle (API) nutzen, stellt OpenAI eine doppelt so hohe Geschwindigkeit bei halben Kosten verglichen mit dem bisherigen Spitzenmodell GPT-4 Turbo in Aussicht.