20.12.2023

KI-Experte Klambauer über Large Language Models: „Brauchen jetzt neue Ideen“

Interview. Steuern wir auf eine Artificial General Intelligence (AGI) zu - oder stoßen die aktuell populären Ansätze bei künstlicher Intelligenz (KI) bald an ihre Grenzen? KI-Forscher Günter Klambauer von der Johannes Kepler Universität Linz erläutert im brutkasten-Gespräch den aktuellen Stand - und wie es mit KI weitergehen könnte.
/artikel/klambauer-neue-ideen-sprachmodelle
KI-Professor Günter Klambauer
Günter Klambauer | Foto: Johannes Kepler Universität Linz

Günter Klambauer ist assozierter Professor für künstliche Intelligenz an der Johannes Kepler Universität Linz. Im brutkasten-Interview erläutert er, wie die Fortschritte bei großen Sprachmodellen (Large Language Models – LLMs) aus technischer Sicht zu bewerten sind und welche Zukunftszenarien für künstliche Intelligenz überhaupt realisitisch sind.


brutkasten: Beruhen die aktuellen Fortschritte bei Large Language Models (LLMs) auf besseren Algorithmen oder doch eher auf stärkerer Rechenpower und höherer Skalierung?

Günter Klambauer: 2019 hat man herausgefunden, dass man einfach durch das bloße Größermachen von Modellen deutliche Verbesserungen erzielen kann. Diese Modelle sind sogenannte künstliche neuronale Netze und bei deren Entwicklung kann man einfach entscheiden, wie groß die sind. Man kann die größer machen, indem man einfach eine Zahl im Programm ändert. 

Für manche in der Forschung war das ein bisschen enttäuschend, denn bis dahin ist man davon ausgegangen, dass man dafür neue Algorithmen brauchen würde. Tatsächlich hat sich aber eben herausgestellt, dass sich die Modelle durch das bloße Größermachen verbessern. 

Das führt aber dazu, dass man mehr Rechenpower benötigt. Für die IT-Giganten wie Google, Facebook, Amazon oder OpenAI war das super. Die verfügen über große Rechenzentren und konnten ihre Modelle einfach immer größer und größer machen. 

Allerdings beruhen nicht alle Fortschritte nur auf Skalierung. Es hat schon auch die sogenannte Transformer-Technologie benötigt. Sie hat dazu geführt, dass Sprachmodelle eben nicht nur übersetzen, sondern auch generieren – basierend auf Texten oder Vervollständigen. Das ist, was wir als Generative Pre-Trained Transformers, als GPTs, kennen.

Welche Rolle spielen die Datensätze dabei?

Das ist die zweite Achse, man füttert die Modelle mit mehr Daten. Früher waren die Datensätze vergleichsweise klein – mit ein paar Milliarden Wörtern aus Wikipedia. Mittlerweile muss man sich das so vorstellen, dass der gesamte textuelle Teil des Internet für das Training verwendet wird – viele Terabytes an Daten. Die Modelle verbessern sich also aus zwei Richtungen: Größere Datensätze sind die eine, und die Modelle vergrößern ist die andere. Beides hilft. 

Wie lange kann man diese Sprachmodelle durch Skalierung weiter verbessern? Erreichen wir Grenzen der Skalierung?

Das weiß man jetzt noch nicht, aber ich glaube schon, dass wir jetzt an dem Punkt sind, an dem Hochskalierung nicht mehr so viel bringt wie früher. Ab jetzt brauchen wir neue Ideen für Sprachmodelle – und neue Technologien. 

Allerdings kann man es oft auch nicht mit Sicherheit sagen: Wenn man nicht zu den IT-Giants gehört, kann man das schwer überprüfen, wo wir gerade stehen. Ein Sprachmodell wie GPT-4 von OpenAI trainiert auf zehntausenden Grafikkarten gleichzeitig. Da gibt es in ganz Europa kein Rechenzentrum, das das durchrechnen könnte. 

Als OpenAI Ende November 2022 den Chatbot ChatGPT veröffentlicht hat, hat dies in der Öffentlichkeit für großes Aufsehen gesorgt. Wie war die Reaktion in der Wissenschaft?

Das war auch für die Wissenschaft erstaunlich. Ich war damals gerade auf einer wissenschaftlichen Konferenz. Dort sind die Leute herumgelaufen und haben ChatGPT am Handy ausprobiert und waren verblüfft. Natürlich haben wir seit 2014 den Trend gesehen, dass Sprachmodelle immer besser und besser wurden. 

Aber erstaunlich war auch, wie leicht zugänglich künstliche Intelligenz dadurch wurde. OpenAI hat dafür gesorgt, dass die Sprachmodelle sehr gut mit Menschen interagieren können. In der Forschung nennt man das “Human Alignment”. Das war etwas Neues. 

Das war übrigens auch ein zusätzlicher Trainingsschritt. ChatGPT hat nicht nur aus bestehenden Texten die Abfolge der Wörter gelernt, sondern es hat auch auf das sogenannte Reinforcement Learning with Human Feedback gesetzt. Es gab bei ChatGPT eine Phase, in der menschliche KI-Trainer dem Modell Feedback gegeben haben.

Dafür gab es allerdings auch Kritik, weil diese Trainer in Kenia rekrutiert wurden und für zwei Dollar in der Stunde gearbeitet haben. Aus wissenschaftlicher Sicht war dies aber ein zusätzlicher Trainingsschritt, über den die Modelle lernen konnten, die menschliche Intention besser zu verstehen.

Kritik gibt es auch der KI-Forschung generell – in Hinblick darauf, dass die Entwicklung außer Kontrolle geraten könnte und Risiken schlagend werden könnten, die jetzt noch nicht absehbar sind. Anfang des Jahres gab es sogar einen Aufruf, die KI-Forschung für ein halbes Jahr auszusetzen. Wie beurteilen Sie dies?

Dieser Call für ein Moratorium ist genau von jenen gekommen, die eigentlich selbst am meisten an dem Thema geforscht haben. Die haben dann auch keine Pause gemacht, sondern weiter Sprachmodelle trainiert.

Das Moratorium wurde wegen angeblich existenziellen Risiken gefordert – einem “Terminator”-Szenario, in dem eine KI die Weltherrschaft übernimmt oder die Menschheit auslöscht. Aber das lenkt einerseits von tatsächlich existenziellen Problemen ab – wie dem Klimawandel oder Atombomben. Andererseits lenkt es auch von den wirklichen Problemen ab, die mit den KI-Systemen schon heute bestehen: Es kommt zu unterschiedlichen Verzerrungen – etwa kann es sein, dass Modelle Frauen schlechter behandeln oder Vorurteile gegenüber bestimmten Bevölkerungsgruppen übernehmen, weil diese in Texten im Internet, anhand derer sie trainiert wurden, enthalten waren. 

Für KI-Systeme legt man außerdem immer Ziele fest – beispielsweise, dass sie eine gute Wortabfolge geben. Wenn Sprachmodelle mit “I am as an AI Agent” antworten, verstärkt das unsere Tendenz zum Anthropomorphismus, also dass wir Dingen menschliche Eigenschaften zuschreiben.

Durch Filme wie “Terminator” kommt es zu dieser Idee, dass KI-Systeme eigene Ziele haben und den Menschen möglicherweise unterwerfen wollen – weil eben Menschen über anderen Menschen herrschen wollen. Ein KI-System will das aber gar nicht. “Intelligenz” an sich bedeutet überhaupt nicht, dass man über andere herrschen möchte – das ist auch wieder ein Anthropomorphismus. 

Für KI-Systeme geben wir die Ziele vor – eben für ein Sprachmodell, dass sie eine Wortfolge gut vorhersagt. Hier gibt es natürlich das Risiko des Missbrauchs – etwa dass so ein System eingesetzt wird, um Fake News zu erzeugen. Da ist ein tatsächliches Problem, da ist aber wieder der Mensch dahinter. Es ist nicht das Ziel des KI-Systems selbst, Fake News zu erzeugen.

Ist das Konzept einer Artificial General Intelligence (AGI) für Sie damit in den Bereich Science Fiction einzuordnen – oder ist eine solche doch ein Szenario, das in den nächsten Jahrzehnten eintreten könnte?

Ja, ich glaube, dass das ein Science-Fiction-Konzept ist, das sich wieder sehr an dem Konzept menschlicher Intelligenz anlehnt. Wenn KIs besser werden, bezieht sich das immer nur auf bestimmte Bereiche. In der Bilderkennung haben KIs menschliche Qualität schon erreicht. Teilweise ist es sogar so, dass es uns als Menschen bei Bildern, auf denen viele ähnliche Dinge sind, schwer gefällt, irgendwas zu erkennen. Für eine KI ist das dagegen einfach.

Es gibt Dinge, die für Menschen extrem einfach sind und für eine KI wahnsinnig schwer und das auch noch lange bleiben werden. Das betrifft zum Beispiel motorische  Fähigkeiten – sehen Sie sich einmal an, wenn ein Roboter etwas aufheben muss, das am Boden liegt. 

Dass sich eine KI immer weiterentwickelt und dann exakt die menschliche Intelligenz erreicht – das wird so nicht ablaufen. Es wird zuerst Zwischenstufen geben, aber nicht den einen Moment, an dem man sagt, jetzt ist eine AGI erreicht oder nicht. In manchen Bereichen, wie zum Beispiel Bilderkennung oder Schach oder Go spielen, ist KI sogar dem Menschen schon überlegen.

Ist es somit aus Ihrer Sicht illusorisch, wenn davon gesprochen wird, dass künstliche Intelligenz irgendwann ein Bewusstsein entwickeln könnte?

Wenn Sie am Computer zwei Matrizen multiplizieren, sagt niemand, dass ein Ergebnis ein leichtes Bewusstsein habe. Genau das ist, was jetzt passiert. In einem neuronalen Netz werden sehr viele Matrix-Multiplikationen vorgenommen. Aber dass das Modell deswegen ein Bewusstsein entwickeln soll, ist meiner Meinung nach ein starker Anthropomorphismus.

Wenn man mit ChatGPT interagiert, erhält man häufig Antworten, die mit der Phrase „As an AI Agent,…“ eingeleitet werden. Das personifiziert sehr stark und versucht uns bis zu einem gewissen Grad glauben zu machen, dass wir wirklich mit einer Person interagieren. Ich hätte es daher bevorzugt, wenn ChatGPT in solchen Fällen „The Large Language Model…“ antworten würde. 

Wenn die gängigen aktuellen KI-Modelle nur mehr von den Tech-Giganten betrieben werden können, weil nur diese die notwendige Rechenpower haben – bedeutet dies, dass künftig einige wenige Large Language Models den Markt dominieren werden und diese auf alle möglichen Use Cases angewendet werden? Oder ist zu erwarten, dass Unternehmen eigene LLMs für spezifische Fälle trainieren und sich ebenfalls damit etablieren können? 

Das ist eine wirklich entscheidende Frage, über die ich mir auch schon viele Gedanken gemacht habe. Ich denke, dass es darauf hinauslaufen wird, dass es kleine Anzahl von diesen Modellen geben wird. Die Entwicklung könnte hier ähnlich verlaufen wie bei Suchmaschinen. Auch hier gab es am Anfang viele und mittlerweile sind es nur mehr einige wenige. Ich würde schätzen, dass am Ende drei bis fünf LLMs übrig bleiben, die die Leute verwenden. 

Die Frage ist dann: Wer sind diese Anbieter? OpenAI ist definitiv dabei. Schön wäre aber, wenn man es in Europa schaffen würde, ein europäisches Sprachmodell zu bekommen, dass dann zu europäischer Infrastruktur wird, die von Unternehmen verwendet werden kann. Ein Startup könnte dann also sagen, ich nehme dieses europäische Sprachmodell und passe es für meinen Einsatzzweck an.

Müsste ein solches europäisches Modell öffentlich finanziert werden? 

Die Finanzierung könnte zum Beispiel zum Teil öffentlich geschehen und zum Teil über private Investoren, etwa in Form einer Public-Private-Partnership. Wichtig ist jedenfalls immer die Rechenkapazität, die man braucht, um ein großes Sprachmodell zu entwicklen. Zwar gibt es auch in Europa Rechenzentren mit ein paar tausend Grafikkarten, aber die sind aus kleineren Einheiten aufgebaut und erlauben es normalerweise nicht, ein großes Sprachmodell auf allen Grafikkarten gleichzeitig zu trainieren.

Deine ungelesenen Artikel:
03.06.2026

Chef der Wirtschaftsagentur Wien: „Wir denken die Wirtschaftsförderung weiter“

Dominic Weiss, Geschäftsführer der Wirtschaftsagentur Wien, bilanziert die ViennaUP, skizziert die Pläne für das Life Science Center und begründet, warum Wien seine Wirtschaftsförderung markant weiterentwickelt.
/artikel/wirtschaftsagentur-wien-dominic-weiss-interview
03.06.2026

Chef der Wirtschaftsagentur Wien: „Wir denken die Wirtschaftsförderung weiter“

Dominic Weiss, Geschäftsführer der Wirtschaftsagentur Wien, bilanziert die ViennaUP, skizziert die Pläne für das Life Science Center und begründet, warum Wien seine Wirtschaftsförderung markant weiterentwickelt.
/artikel/wirtschaftsagentur-wien-dominic-weiss-interview
Dominic Weiss, Geschäftsführer der Wirtschaftsagentur Wien | (c) Paul Bauer

Kürzlich ist die ViennaUP über die Bühne gegangen, und zwar mit Rekordandrang. Mehr als 14.000 Teilnehmende aus über 90 Ländern und 28 internationale Delegationen kamen nach Wien, um sich beim internationalen Startup-Festival zu vernetzen, Investor:innen zu treffen und den Standort als möglichen Ankerpunkt zu sondieren. Über 65 Veranstaltungen an 43 Locations in nur fünf Tagen, ein Großteil davon restlos ausgebucht.

Die ViennaUP ist aber nur ein Baustein in der Wiener Innovationsstrategie. Mit dem Life Science Center entsteht bis 2029 eine zentrale Forschungs- und Produktionsinfrastruktur, und mit der neuen Beteiligungsgesellschaft Wiener Wachstum geht die Wirtschaftsagentur einen für sie neuen Weg, weg vom klassischen Zuschuss, hin zur echten Beteiligung. Im Interview spricht der Geschäftsführer der Wirtschaftsagentur Wien über die Bilanz der ViennaUP, das große Infrastrukturprojekt im Life-Science-Bereich und einen Paradigmenwechsel in der Förderlogik.


brutkasten: Die Economica-Studie zur ViennaUP weist 3,5 Millionen Euro Wertschöpfung und fast 50 gesicherte Stellen aus. Sie haben das heuer erstmals so evaluieren lassen. War etwas Überraschendes dabei?

Dominic Weiss: Wir haben es das erste Mal in dieser Form gemacht, und es ist etwas, worauf die Wirtschaftsagentur viel Wert legt. Wir brauchen ein belastbares Zahlenwerk, das unsere Wirkung am Standort zeigt. Wir haben den Auftrag und auch den Anspruch, sorgsam mit Steuergeld umzugehen. Überraschend war im Grunde nichts. Wir waren immer schon überzeugt, dass das, was wir tun, Wirkung hat. Aber gerade in Zeiten eines großen Konsolidierungsprozesses ist es wichtig, mit Zahlen aufzuwarten. Positiv überrascht hat mich vor allem, wie viele Ansiedlungen tatsächlich auf die ViennaUP zurückzuführen sind. Das zeigt, dass unser internationaler Ansatz wirkt, und zwar indirekt in einem ganz anderen Bereich der Wirtschaftsagentur. Auch die durch Startups ausgelösten Investitionen zahlen direkt fiskalpolitisch in die Stadt ein. Das sind wirklich gute Zahlen.

Im Vergleich zu Web Summit oder Slush positioniert sich die ViennaUP sehr eigenständig. Wollen Sie dieses Konzept weiterführen?

Davon bin ich überzeugt. Wir haben einen sehr glücklichen Schulterschluss zwischen Privatwirtschaft, öffentlichem Bereich und Wissenschaft. Die Wirtschaftsagentur ist hier der gemeinsame Nenner, der initiiert und in der Mitte steht. Aber wir brauchen einen dezentralen Ansatz und starke Partner:innen. Fest steht auch, dass wir die ViennaUP kontinuierlich weiterentwickeln. Und das werden wir auch im kommenden Jahr tun.

Was unterscheidet die ViennaUP grundsätzlich von einem Web Summit?

Bei einem Web Summit wird in riesiger Breite über Technik gesprochen, oft ohne klare Haltung. Ist Blockchain Zukunft oder nicht. Bei der ViennaUP geht es darum: Wie wirkt das, was wir hier tun? Für den Wirtschaftsstandort, das ist klar. Für uns geht es nicht nur um Wirtschaft per se, sondern auch um Lösungen für unsere Bürger:innen, für unser Umfeld, für Lebensqualität. Diese Verantwortung in einem sozialen und nachhaltigen Umfeld zeichnet Wien aus. Wien hat immer schon eine andere soziale Verantwortung gehabt. Die ViennaUP schlägt daher eine wertvolle Brücke zwischen Business und sozialem Impact. Das trifft auf andere Startup-Events dieser Art weniger zu. Die ViennaUP, das ist mehr als nur Business.

Die Homebase am Karlsplatz war auch heuer wieder Anlaufpunkt des Startup-Festivals. © Wirtschaftsagentur Wien / Philipp Lipiarski

Sie investieren rund 170 Millionen Euro in das Life Science Center, Fertigstellung 2029. Wohin geht die Stoßrichtung?

Wir schauen uns sehr genau an, wo der Markt etwas noch nicht regelt und wo wir einen Anstoß setzen können. Im Wiener Raum gibt es einen klaren Mangel an Laborflächen: günstig, in hoher Qualität, als Shared Facilities, bereichsübergreifend zwischen Wissenschaft und Wirtschaft. Vor allem für Spin-offs, die gründen oder gerade gegründet haben, fehlt diese Infrastruktur. Wir schaffen daher rund 14.000 Quadratmeter mit hochwertiger Laborinfrastruktur und genauso viel Community-Fläche, wo Begegnung und gemeinsames Arbeiten stattfinden. Mit der Akademie der Wissenschaften und ihrem Institut AITHYRA haben wir einen starken Anker-Mieter im Bereich Biotech und KI. Wir betreiben schon im Vienna Bio Center erfolgreich Startup Labs. Die sind seit Jahren ausgebucht. Wir wissen also genau, welcher Druck am Markt herrscht.

500 Arbeitsplätze sollen entstehen?

Ja, aber das Wichtigere ist: 500 sehr hochwertige Arbeitsplätze mit hoher Wertschöpfung. Diese sind für eine Metropole wie Wien außerordentlich wichtig. Wir haben viele Arbeitsplätze im Tourismus, aber bei den hochwertigen muss Wien echte Akzente setzen. Mit dieser Infrastruktur gehen wir einen Schritt voraus.

Drittes Thema: Wiener Wachstum. Eine GmbH gemeinsam mit der Raiffeisen Bank International, 7 Millionen Euro Startkapital, Tickets zwischen 100.000 und 500.000 Euro. Wie sieht der Plan konkret aus?

Wir schaffen mit Wiener Wachstum ein Instrument, um mit Eigenkapitalinstrumenten wachstumsorientierte Unternehmen in der Digital- und Gesundheitswirtschaft zu unterstützen. Und wir schließen damit für einen ganz relevanten Bereich eine Lücke, die wir am Standort bisher nicht schließen konnten. Wir haben in Wien klassisch wachstumsorientierte Unternehmen, die schon am Markt sind, erste Umsätze haben und vor ihrem ersten großen Wachstumsschritt stehen. Diese müssen oft große Investitionen tätigen, für die es keine Finanzierung gibt. Eine Maschine anschaffen, mehr Personal anstellen, skalieren. Die klassischen Projektförderungen greifen hier zu kurz. Sie brauchen Eigenkapital oder eigenkapitalähnliche Instrumente, Stichwort Mezzanine. Genau dort und nur dort wollen wir hinein, fokussiert auf Life Science und Digitalwirtschaft. Hier gilt: Für uns ist die Fokussierung enorm wichtig, mit einem Startvolumen von 7 Millionen Euro und maximalen Ticketgrößen von 500.000 Euro wird es vor allem auch um Qualität gehen.

Ist das ein Paradigmenwechsel?

Ja, das kann man so sagen. Wir denken die Wirtschaftsförderung weiter. Die Wirtschaftsagentur gibt es seit 1982, und wir haben in klassischen Förderungen gedacht. Mit Wiener Wachstum gehen wir einen neuen Weg, zusätzlich zu den nicht rückzahlbaren Zuschüssen. Es geht um echte Beteiligungen. Das bringt uns auch mehr Marktnähe und wir sind gespannt auf die Wirkung. Auch für das Unternehmen ist es ein anderes Commitment, wenn sich Wirtschaftsagentur und Raiffeisen beteiligen.

Heißt das, klassische Zuschüsse werden zurückgefahren?

Nein. Wir werden Förderungen natürlich weiterentwickeln und auch hier stärker fokussieren. Das ist unser Anspruch. Denn wir wollen gemeinsam mit den Unternehmen die stärkste Wirkung für die Stadt erzielen.

Wie passt das alles zusammen, ViennaUP, Life Science Center, Wiener Wachstum?

Als Standortagentur orchestrieren wir unsere Angebote im absoluten Gleichklang, um die optimale Wirkung für die Unternehmen und Wien zu erzielen. Unternehmen finden in Wien im internationalen Vergleich ein sehr umfassendes Förderangebot. Passgenaue Produkte zum richtigen Zeitpunkt, aus einer Hand flankiert von persönlicher Betreuung. Mit der ViennaUP vernetzen wir und schaffen Awareness. Mit dem Life Science Center stellen wir Infrastruktur bereit, leistbar, mit einem breiten Bespielungsmix. Und mit Wiener Wachstum begleiten wir den nächsten Wachstumsschritt. Wir können nicht alles regeln, aber wir können genau dort unterstützen, wo es nötig ist, damit Unternehmen am Markt erfolgreich sein können.

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

KI-Experte Klambauer über Large Language Models: „Brauchen jetzt neue Ideen“

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

KI-Experte Klambauer über Large Language Models: „Brauchen jetzt neue Ideen“

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

KI-Experte Klambauer über Large Language Models: „Brauchen jetzt neue Ideen“

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

KI-Experte Klambauer über Large Language Models: „Brauchen jetzt neue Ideen“

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

KI-Experte Klambauer über Large Language Models: „Brauchen jetzt neue Ideen“

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

KI-Experte Klambauer über Large Language Models: „Brauchen jetzt neue Ideen“

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

KI-Experte Klambauer über Large Language Models: „Brauchen jetzt neue Ideen“

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

KI-Experte Klambauer über Large Language Models: „Brauchen jetzt neue Ideen“

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

KI-Experte Klambauer über Large Language Models: „Brauchen jetzt neue Ideen“