29.01.2025
KÜNSTLICHE INTELLIGENZ

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

Gastbeitrag. Kostengünstig trainiert, Open Source und aus China: Das neue KI-Modell DeepSeek sorgt aktuell für Aufsehen. Aber wie gut ist es wirklich und welche Folgen wird es mit sich ziehen? Apollo.ai-Co-Founder Mic Hirschbrich ordnet ein.
/artikel/deepseek-mic-hirschbrich
Mic Hirschbrich, KI-Experte und Co-Founder von Apollo.ai
Mic Hirschbrich, KI-Experte und Co-Founder von Apollo.ai | Foto: brutkasten, Adobe Stock

Die KI-Welt wurde vor wenigen Tagen von einer Nachricht erschüttert: DeepSeek, ein chinesisches Open-Source-Sprachmodell, soll mit nur 6 Millionen US-Dollar trainiert worden sein. Ein Betrag, der im Vergleich zu den Milliarden, die für GPT-4 oder Claude-Modelle aufgewendet wurden, verschwindend gering erscheint.

Doch wie konnte das möglich sein? Welche Implikationen hat das für den Markt? Und ist die Panik an der Börse – insbesondere bei Nvidia – gerechtfertigt? Eine Analyse.

Das Rätsel um die niedrigen Kosten.

Eines ist klar: Die genaue Hardware-Infrastruktur, mit der DeepSeek trainiert wurde, ist nicht offengelegt. Aufgrund von US-Exportbeschränkungen ist es auch unwahrscheinlich, dass Nvidia-Hardware in großem Umfang zum Einsatz kam oder dies gegebenenfalls der Medienöffentlichkeit gegenüber je offengelegt wird.

Folgende Hypothesen werden diskutiert und werden teilweise durch publizierte Dokumentationen gestützt:

  • Durch innovative Algorithmen könnte die Effizienz des Trainings erheblich verbessert worden sein. Methoden wie Low-Rank Adaptation (LoRA) oder Quantisierung reduzierten demnach den Rechenaufwand, mitunter erheblich.
  • DeepSeek könnte zudem von existierenden Modellen gelernt haben. Mittels dem sogenannten “Knowledge Destillation” lassen sich leistungsfähige Modelle mit deutlich geringerem Rechenaufwand trainieren, indem sie aus den Antworten bereits bestehender KIs lernen. Dieser Vorwurf wird noch aus 2-facher Richtung beleuchtet werden, nämlich ob und in welchem Umfang dies stattfand und inwiefern das problematisch sein könnte und künftig zu verhindern wäre.
  • Spekuliert wird zudem, dass das Modell mit einer optimierten Architektur arbeiten könnte, die es ermöglicht, mit weniger Rechenleistung eine vergleichbare Leistung zu erzielen.

Doch was in der (fast schon zu) lauten Diskussion fast vollends untergeht: Die Bereitstellung und der Betrieb eines leistungsfähigen Sprachmodells kostet immense Summen, nicht nur das Training. Hosting, API-Anfragen und die globale Skalierung verursachen hohe laufende Kosten.

Dass DeepSeek also mit 6 Millionen Dollar für das Training auskam wird von vielen bezweifelt. Dass der zentrale Betrieb für potentiell hunderte Millionen User dementsprechend kostengünstig sein kann, erst recht. Dem Markt und den Nutzern würde hier mehr Transparenz gut tun. 

Reaktionen der Märkte: Nvidia-Absturz übertrieben?

Als die Nachricht von DeepSeek bekannt wurde, erlebte Nvidia einen massiven Kursrückgang. Doch ist dieser in diesem Ausmaß gerechtfertigt? Das hängt auch davon ab, welche Annahmen bei der Hardware-Skalierung börslich eingepreist wurden und die Antwort darauf ist vielschichtig. Für viele scheinen die Nachrichten eines dramatisch effizienter trainierenden LLMs alarmierend gewesen zu sein. 

Trotz der potenziellen Effizienzgewinne bleibt aber eines sicher: KI wird weiterhin enorme Mengen an Rechenleistung und Chips benötigen. Zumal die Ziele ja noch lange nicht erreicht sind, strebt man doch nach der “Agent-Revolution” nichts geringeres als AGI-Führerschaft an.

Die steigende Nachfrage nach Hochleistungsrechenzentren, die KI-Modelle hosten und betreiben, bleibt mit Sicherheit bestehen. Und gerade wenn sich Open-Source-Modelle weiter etablieren, könnte der Bedarf an Infrastrukturen steigen, auch hier stehen wir erst ganz am Beginn globaler Markt-Positionierungen.

Warum DeepSeek vorerst erfolgreich ist:

DeepSeek hat eine kluge Strategie verfolgt:

  • Das Modell wurde sofort direkt für die Öffentlichkeit freigegeben. Innerhalb weniger Tage erzielte es so millionenfache Installationen und avancierte zur meistgenutzten KI und stieß, zumindest im App Store, sogar ChatGPT vom Thron.
  • Open Source ermöglichte zusätzlich eine hohe Verbreitungsgeschwindigkeit. Entwickler weltweit testen das Modell und integrieren es in Anwendungen. Doch um sich langfristig in diesem Markt zu halten braucht es klare Use Cases und – vor allem – Vertrauen (sic!) in die “Integrität” der Modelle und Anbieter. 

Wie wird die Antwort auf DeepSeek lauten?

Die etablierten KI-Giganten OpenAI, Google DeepMind und Gemini, Anthropic und Co haben einen Vorteil: Gigantische Infrastrukturen, tiefe Taschen und den Zugang zu Hunderttausenden von Nvidia-Chips. Sie werden sich die Verbesserungsmethoden nun genau ansehen, dort wo sinnvoll integrieren und mit ihrer überlegenen Infrastruktur kombinieren. Damit könnte das Rennen wieder neue Dynamik entfalten, die am Ende aber gut für die Märkte ist, da der Konkurrenz-Druck zu guten Modellen immer weiter steigt. 

Die unterschätzte geopolitische Dimension von LLMs

Was wir bei all dem spannenden technologische Implikationen nicht vergessen dürfen: LLMs sind nicht nur Technologie, sie sind auch inhärent politisch. In einem früheren Kommentar schrieb ich einmal: Sie sind das wichtigste und einflussreichste – kulturelle Exportgut, das eine moderne Nation hervorbringen kann.

Jedes große Sprachmodell transportiert – auch – Werte, Weltanschauungen und ethische Grundsätze. Und dazu braucht keiner der Anbieter mit den Finger zu zeigen, denn das gilt für alle. Der geopolitische Druck auf Unternehmen und auch die EU, eigene Modelle zu entwickeln, wird daher umso mehr steigen.

Altmanns Herausforderung: Der Wandel des Narrativs

Für OpenAI und Sam Altman ergibt sich eine neue Herausforderung: Bisher war ein zentrales Argument für Investoren, dass Transformer-Modelle enorme Rechenleistung benötigten und neben der Logik  die schiere Übermacht an Rechenleistung für die Qualität generativer Modelle sorgen. Wenn DeepSeek zeigt, dass vergleichbare Modelle mit geringeren Kosten trainiert werden können, wird das OpenAI unter Druck setzen, ihr Finanzierungsmodell neu zu rechtfertigen. 

Interessant ist, dass selbst OpenAI-Researcher und Sam Altman die Leistung von DeepSeek auch öffentlich in sozialen Medien anerkennen und das doch sehr zeitnah, noch bevor man sich detailliert mit dem Rivalen beschäftigen konnte. Ob das Narrativ von der notwendigen, exorbitanten Rechenleistung für Top-Modelle aufrechterhalten werden kann, bleibt abzuwarten und besonders spannend. Und einer ist von dieser Markt-Einschätzung besonders betroffen: Branchen-Primus Nvidia. 

Fazit und Ausblick für Europa?

Europa hat hier eine Chance. Der europäische Datenmarkt gilt als qualitativ hochwertig. Intelligente, spezialisierte KI-Lösungen, die mit diesen Daten arbeiten, könnten eine neue Exportgeneration smarter Anwendungen hervorbringen.

KI wird immer mehr zu einem Commodity-Gut und Konkurrenz und Diversifikation ist dabei prinzipiell etwas Positives. Ich spreche dazu in meinen Vorträgen seit vielen Jahren. Die Grenzkosten für Intelligenz werden weiter sinken und die generativen Angebote austauschbar werden.

Der wahre Mehrwert von KI  für Europa wird in spezialisierten B2B-Anwendungen liegen. Die Zeit, in der das Modell selbst das Alleinstellungsmerkmal war, wird sich bald dem Ende neigen. Der Fokus verschiebt sich zunehmend auf belastbare und sichere Anwendungen, die einen messbaren Mehrwert stiften.


Mic Hirschbrich in der brutkasten-Videoserie “No Hype KI” – Wie verändert künstliche Intelligenz Geschäftsmodelle?

Deine ungelesenen Artikel:
03.02.2025

KI in Europa: “Müssen aggressiv reingehen, um unseren Wohlstand zu halten”

Was braucht es, damit Österreich und Europa bei künstlicher Intelligenz nicht zurückfallen? Diese Frage diskutierten Hermann Erlach (Microsoft), Marco Porak (IBM), Peter Ahnert (Nagarro) und Jeannette Gorzala in der vorerst letzten Folge der brutkasten-Serie "No Hype KI".
/artikel/no-hype-ki-folge-6
03.02.2025

KI in Europa: “Müssen aggressiv reingehen, um unseren Wohlstand zu halten”

Was braucht es, damit Österreich und Europa bei künstlicher Intelligenz nicht zurückfallen? Diese Frage diskutierten Hermann Erlach (Microsoft), Marco Porak (IBM), Peter Ahnert (Nagarro) und Jeannette Gorzala in der vorerst letzten Folge der brutkasten-Serie "No Hype KI".
/artikel/no-hype-ki-folge-6
Peter Ahnert, Hermann Erlach, Marco Porak und Jeannette Gorzala
Peter Ahnert, Hermann Erlach, Marco Porak und Jeannette Gorzala | Foto: brutkasten

“No Hype KI” wird unterstützt von CANCOM AustriaIBMITSVMicrosoftNagarroRed Hat und Universität Graz.


Wo stehen wir wirklich, was die Adaption von künstlicher Intelligenz in der österreichischen Wirtschaft angeht? Diese Frage zu beantworten war eines der Ziele der Serie “No Hype KI“, die brutkasten anlässlich des zweijährigen Bestehens von ChatGPT gestartet hat. Die ersten fünf Folgen beleuchten unterschiedliche Aspekte des Themas und lieferten eine Bestandsaufnahme.

Im Staffelfinale, der sechsten Folge, war der Blick dann in Richtung Zukunft gerichtet. Dazu fanden sich die Österreich-Chefs von Microsoft und IBM, Hermann Erlach und Marco Porak, sowie Nagarros Big Data & AI Practice Lead für Central Europe, Peter Ahnert, und KI-Expertin Jeannette Gorzala, die auch Mitglied des KI-Beirats der österreichischen Bundesregierung ist, im brutkasten-Studio ein.

“Der Hype ist weg und das ist eine gute Sache”

Eine der Erkenntnisse der Serie: Unternehmen und Institutionen verabschieden sich von überschwänglichen Erwartungen und sehen sich stattdessen an, wie KI tatsächlich in der Praxis eingesetzt wird. „Der Hype ist weg und das ist eine gute Sache, weil jetzt kann man auf den Use Case gehen“, sagt Hermann Erlach, General Manager von Microsoft Österreich, im Videotalk. Er vergleicht den aktuellen Reifegrad von KI mit dem Beginn einer langen Reise: „Wenn ich so eine Reise angehe, dann brauche ich ein Ziel, einen Plan und Mitreisende. Alleine macht das wenig Spaß.“

Auch Marco Porak, General Manager von IBM in Österreich, schlägt in eine ähnliche Kerbe. Er sieht das abgelaufene Jahr als eine Phase der Erkenntnis. Den Status Quo bei KI in Österreichs Unternehmen beschreibt er im Talk folgendermaßen: “Wir haben allerorts sehr viel ausprobiert, sind vielleicht da und dort auf die Nase gefallen”. Gleichzeitig habe es auch “schöne Erfolge” gegeben. Für Porak ist klar: “Die Frage der Stunde lautet: Wie machen wir jetzt von hier weiter?“

AI Act: “Jetzt müssen wir ins Tun kommen”

Ein großes Thema dabei ist der AI Act der EU. Jeannette Gorzala, Gründerin von Act.AI.Now, plädiert für eine pragmatische Haltung gegenüber der EU-Verordnung: “Der AI-Act ist ein Faktum, er ist da. Jetzt müssen wir ins Tun kommen.” Sie sieht in dem Regelwerk einen Wegweiser: “Wir müssen die entsprechenden Kompetenzen aufbauen und die Möglichkeiten nutzen, die diese Regulierung bietet. Das ist der Reiseplan, den wir brauchen.”

Auch Marco Porak sieht den AI Act positiv: „Er hat nicht die Algorithmen reguliert, sondern gesagt, was wir in Europa gar nicht wollen, etwa Sozialpunktesysteme oder Gesichtserkennung in Echtzeit.“ So entstehe für Unternehmen im globalen Wettbewerb ein Vorteil, wenn sie ihre KI-Anwendung nach europäischen Maßstäben zertifizieren lassen: „Das ist wie ein Gütesiegel.“

“Müssen positiv aggressiv reingehen, um unseren Wohlstand zu halten”

Hermann Erlach von Microsoft bezeichnet den Ansatz des AI Act ebenfalls als “gut”, betont aber gleichzeitig, dass es jetzt auf die Umsetzung von KI-Projekten ankomme: “Wir haben eine Situation, in der jedes Land an einem neuen Startpunkt steht und wir positiv aggressiv reingehen müssen, um unseren Wohlstand zu halten.”

Peter Ahnert sieht dabei auch ein Problem in der öffentlichen Wahrnehmung: KI werde tendenziell nicht nur zu klein gedacht, sondern meist auch in Zusammenhang mit Risiken wahrgenommen: “Es werden die Chancen nicht gesehen.” Woran liegt es? “Zu einem erheblichen Teil daran, dass noch zu wenig Bildung und Aufklärung an dem Thema da ist. In Schulen, in Universitäten, aber auch in Unternehmen und in der öffentlichen Hand.” Hier müsse man ansetzen, sagt der Nagarro-Experte.

Jeannette Gorzala sieht das ähnlich: “Bildung und Kompetenz ist das große Thema unserer Zeit und der zentrale Schlüssel.” Verstehe man etwas nicht, verursache dies Ängste. Bezogen auf KI heißt das: Fehlt das Verständnis für das Thema, setzt man KI nicht ein. Die Opportunitätskosten, KI nicht zu nutzen, seien aber “viel größer” als das Investment, das man in Bildung und Governance tätigen müssen. “Natürlich ist es ein Effort, aber es ist wie ein Raketenstart”, sagt Gorzala.

IBM-Programm: “Die Angst war weg”

Wie das in der Praxis funktionieren kann, schilderte IBM-Chef Porak mit einem Beispiel aus dem eigenen Unternehmen. IBM lud weltweit alle Mitarbeitenden zu einer KI-Challenge, bei der Mitarbeiter:innen eigene KI-Use-Cases entwickelten, ein – mit spürbaren Folgen: “Die Angst war weg.” Seine Beobachtung: Auch in HR-Teams stieg die Zufriedenheit, wenn sie KI als Assistenz im Arbeitsablauf nutzen. “Sie können sich auf die komplexen Fälle konzentrieren. KI übernimmt die Routine.”

Microsoft-Chef Erlach warnt auch davor, das Thema zu stark unter Bezug auf rein technische Skills zu betrachten: “Die sind notwendig und wichtig, aber es geht auch ganz viel um Unternehmens- und Innovationskultur. Wie stehen Führungskräfte dem Thema AI gegenüber? Wie steht der Betriebsrat dem Thema AI gegenüber?”, führt er aus.

Venture Capital: “Müssen in Europa ganz massiv was tun”

Soweit also die Unternehmensebene. Einen große Problemstelle gibt es aber noch auf einem anderen Level: Der Finanzierung von Innovationen mit Risikokapital. “An der Stelle müssen wir in Europa ganz massiv was tun”, merkte Ahnert an. Er verwies auf Beispiele wie DeepMind, Mistral oder Hugging Face, hinter denen jeweils europäische Gründer stehen, die aber in den USA gegründet, ihre Unternehmen in die USA verkauft oder zumindest vorwiegend aus den USA finanziert werden.

Der Nagarro-Experte verwies dazu auf eine Studie des Applied AI Institute, für die Startups aus dem Bereich generative KI zu den größten Hürden, mit denen sie es zu tun haben, befragt wurden. “51 Prozent haben Funding genannt. Weit abgeschlagen an zweiter Stelle mit 24 Prozent erst kam die Regulierung und unter 20 Prozent waren Themen wie Fachkräftemangel oder Zugang zu Compute Power.” Ahnerts Appell: “Bei dem Thema Finanzierung müssen wir was tun, damit wir in der nächsten Welle an der Spitze sind.”

Erlach: Adaption entscheidend

Letztlich sei aber vielleicht gar nicht so entscheidend, wo eine Technologie produziert werde, argumentierte Hermann Erlach von Microsoft. Denn es komme auf die Adaption an: “Vielleicht ist die Diskussion Europa vs. Amerika in Teilbereichen die falsche.” Die wichtigere Frage sei also: “Wie adaptiere ich diese Technologie möglichst schnell, um meinen Wohlstand zu erhöhen?”

Marco Porak ergänzt: “Ganz, ganz wesentlich ist Mut. Ganz, ganz wesentlich ist unsere kulturelle Einstellung zu dem Thema.” Man müsse die Chancen sehen und weniger das Risiko. In der Regulatorik könne man dies begleiten, indem man Anreize schafft. “Und ich glaube, wenn wir das als Österreich mit einem großen Selbstbewusstsein und auch als Europa mit einem großen Selbstbewusstsein machen, dann haben wir in fünf Jahren eine Diskussion, die uns durchaus stolz machen wird.”


Die gesamte Folge ansehen:


Die Nachlesen der bisherigen Folgen:

Folge 1: “No Hype KI – wo stehen wir nach zwei Jahren ChatGPT?”

Folge 2: “Was kann KI in Gesundheit, Bildung und im öffentlichen Sektor leisten?”

Folge 3: “Der größte Feind ist Zettel und Bleistift”: Erfolgsfaktoren und Herausforderungen in der KI-Praxis”

Folge 4: KI-Geschäftsmodelle: “Wir nutzen nur einen Bruchteil dessen, was möglich ist”

Folge 5: Open Source und KI: “Es geht nicht darum, zu den Guten zu gehören”


Die Serie wird von brutkasten in redaktioneller Unabhängigkeit mit finanzieller Unterstützung unserer Partner:innen produziert.

No Hype KI

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet