29.01.2025
KÜNSTLICHE INTELLIGENZ

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

Gastbeitrag. Kostengünstig trainiert, Open Source und aus China: Das neue KI-Modell DeepSeek sorgt aktuell für Aufsehen. Aber wie gut ist es wirklich und welche Folgen wird es mit sich ziehen? Apollo.ai-Co-Founder Mic Hirschbrich ordnet ein.
/artikel/deepseek-mic-hirschbrich
Mic Hirschbrich, KI-Experte und Co-Founder von Apollo.ai
Mic Hirschbrich, KI-Experte und Co-Founder von Apollo.ai | Foto: brutkasten, Adobe Stock

Die KI-Welt wurde vor wenigen Tagen von einer Nachricht erschüttert: DeepSeek, ein chinesisches Open-Source-Sprachmodell, soll mit nur 6 Millionen US-Dollar trainiert worden sein. Ein Betrag, der im Vergleich zu den Milliarden, die für GPT-4 oder Claude-Modelle aufgewendet wurden, verschwindend gering erscheint.

Doch wie konnte das möglich sein? Welche Implikationen hat das für den Markt? Und ist die Panik an der Börse – insbesondere bei Nvidia – gerechtfertigt? Eine Analyse.

Das Rätsel um die niedrigen Kosten.

Eines ist klar: Die genaue Hardware-Infrastruktur, mit der DeepSeek trainiert wurde, ist nicht offengelegt. Aufgrund von US-Exportbeschränkungen ist es auch unwahrscheinlich, dass Nvidia-Hardware in großem Umfang zum Einsatz kam oder dies gegebenenfalls der Medienöffentlichkeit gegenüber je offengelegt wird.

Folgende Hypothesen werden diskutiert und werden teilweise durch publizierte Dokumentationen gestützt:

  • Durch innovative Algorithmen könnte die Effizienz des Trainings erheblich verbessert worden sein. Methoden wie Low-Rank Adaptation (LoRA) oder Quantisierung reduzierten demnach den Rechenaufwand, mitunter erheblich.
  • DeepSeek könnte zudem von existierenden Modellen gelernt haben. Mittels dem sogenannten „Knowledge Destillation“ lassen sich leistungsfähige Modelle mit deutlich geringerem Rechenaufwand trainieren, indem sie aus den Antworten bereits bestehender KIs lernen. Dieser Vorwurf wird noch aus 2-facher Richtung beleuchtet werden, nämlich ob und in welchem Umfang dies stattfand und inwiefern das problematisch sein könnte und künftig zu verhindern wäre.
  • Spekuliert wird zudem, dass das Modell mit einer optimierten Architektur arbeiten könnte, die es ermöglicht, mit weniger Rechenleistung eine vergleichbare Leistung zu erzielen.

Doch was in der (fast schon zu) lauten Diskussion fast vollends untergeht: Die Bereitstellung und der Betrieb eines leistungsfähigen Sprachmodells kostet immense Summen, nicht nur das Training. Hosting, API-Anfragen und die globale Skalierung verursachen hohe laufende Kosten.

Dass DeepSeek also mit 6 Millionen Dollar für das Training auskam wird von vielen bezweifelt. Dass der zentrale Betrieb für potentiell hunderte Millionen User dementsprechend kostengünstig sein kann, erst recht. Dem Markt und den Nutzern würde hier mehr Transparenz gut tun. 

Reaktionen der Märkte: Nvidia-Absturz übertrieben?

Als die Nachricht von DeepSeek bekannt wurde, erlebte Nvidia einen massiven Kursrückgang. Doch ist dieser in diesem Ausmaß gerechtfertigt? Das hängt auch davon ab, welche Annahmen bei der Hardware-Skalierung börslich eingepreist wurden und die Antwort darauf ist vielschichtig. Für viele scheinen die Nachrichten eines dramatisch effizienter trainierenden LLMs alarmierend gewesen zu sein. 

Trotz der potenziellen Effizienzgewinne bleibt aber eines sicher: KI wird weiterhin enorme Mengen an Rechenleistung und Chips benötigen. Zumal die Ziele ja noch lange nicht erreicht sind, strebt man doch nach der „Agent-Revolution“ nichts geringeres als AGI-Führerschaft an.

Die steigende Nachfrage nach Hochleistungsrechenzentren, die KI-Modelle hosten und betreiben, bleibt mit Sicherheit bestehen. Und gerade wenn sich Open-Source-Modelle weiter etablieren, könnte der Bedarf an Infrastrukturen steigen, auch hier stehen wir erst ganz am Beginn globaler Markt-Positionierungen.

Warum DeepSeek vorerst erfolgreich ist:

DeepSeek hat eine kluge Strategie verfolgt:

  • Das Modell wurde sofort direkt für die Öffentlichkeit freigegeben. Innerhalb weniger Tage erzielte es so millionenfache Installationen und avancierte zur meistgenutzten KI und stieß, zumindest im App Store, sogar ChatGPT vom Thron.
  • Open Source ermöglichte zusätzlich eine hohe Verbreitungsgeschwindigkeit. Entwickler weltweit testen das Modell und integrieren es in Anwendungen. Doch um sich langfristig in diesem Markt zu halten braucht es klare Use Cases und – vor allem – Vertrauen (sic!) in die „Integrität“ der Modelle und Anbieter. 

Wie wird die Antwort auf DeepSeek lauten?

Die etablierten KI-Giganten OpenAI, Google DeepMind und Gemini, Anthropic und Co haben einen Vorteil: Gigantische Infrastrukturen, tiefe Taschen und den Zugang zu Hunderttausenden von Nvidia-Chips. Sie werden sich die Verbesserungsmethoden nun genau ansehen, dort wo sinnvoll integrieren und mit ihrer überlegenen Infrastruktur kombinieren. Damit könnte das Rennen wieder neue Dynamik entfalten, die am Ende aber gut für die Märkte ist, da der Konkurrenz-Druck zu guten Modellen immer weiter steigt. 

Die unterschätzte geopolitische Dimension von LLMs

Was wir bei all dem spannenden technologische Implikationen nicht vergessen dürfen: LLMs sind nicht nur Technologie, sie sind auch inhärent politisch. In einem früheren Kommentar schrieb ich einmal: Sie sind das wichtigste und einflussreichste – kulturelle Exportgut, das eine moderne Nation hervorbringen kann.

Jedes große Sprachmodell transportiert – auch – Werte, Weltanschauungen und ethische Grundsätze. Und dazu braucht keiner der Anbieter mit den Finger zu zeigen, denn das gilt für alle. Der geopolitische Druck auf Unternehmen und auch die EU, eigene Modelle zu entwickeln, wird daher umso mehr steigen.

Altmanns Herausforderung: Der Wandel des Narrativs

Für OpenAI und Sam Altman ergibt sich eine neue Herausforderung: Bisher war ein zentrales Argument für Investoren, dass Transformer-Modelle enorme Rechenleistung benötigten und neben der Logik  die schiere Übermacht an Rechenleistung für die Qualität generativer Modelle sorgen. Wenn DeepSeek zeigt, dass vergleichbare Modelle mit geringeren Kosten trainiert werden können, wird das OpenAI unter Druck setzen, ihr Finanzierungsmodell neu zu rechtfertigen. 

Interessant ist, dass selbst OpenAI-Researcher und Sam Altman die Leistung von DeepSeek auch öffentlich in sozialen Medien anerkennen und das doch sehr zeitnah, noch bevor man sich detailliert mit dem Rivalen beschäftigen konnte. Ob das Narrativ von der notwendigen, exorbitanten Rechenleistung für Top-Modelle aufrechterhalten werden kann, bleibt abzuwarten und besonders spannend. Und einer ist von dieser Markt-Einschätzung besonders betroffen: Branchen-Primus Nvidia. 

Fazit und Ausblick für Europa?

Europa hat hier eine Chance. Der europäische Datenmarkt gilt als qualitativ hochwertig. Intelligente, spezialisierte KI-Lösungen, die mit diesen Daten arbeiten, könnten eine neue Exportgeneration smarter Anwendungen hervorbringen.

KI wird immer mehr zu einem Commodity-Gut und Konkurrenz und Diversifikation ist dabei prinzipiell etwas Positives. Ich spreche dazu in meinen Vorträgen seit vielen Jahren. Die Grenzkosten für Intelligenz werden weiter sinken und die generativen Angebote austauschbar werden.

Der wahre Mehrwert von KI  für Europa wird in spezialisierten B2B-Anwendungen liegen. Die Zeit, in der das Modell selbst das Alleinstellungsmerkmal war, wird sich bald dem Ende neigen. Der Fokus verschiebt sich zunehmend auf belastbare und sichere Anwendungen, die einen messbaren Mehrwert stiften.


Mic Hirschbrich in der brutkasten-Videoserie „No Hype KI“ – Wie verändert künstliche Intelligenz Geschäftsmodelle?

Deine ungelesenen Artikel:
24.06.2026

Ora Computing: Wiener KI-Startup holt 3,5 Mio. Euro Seed-Finanzierung

Das Wiener KI-Startup Ora Computing hat eine Seed-Finanzierung über 3,5 Millionen Euro abgeschlossen. Mit seiner Technologie zur effizienten Komprimierung großer KI-Modelle will das Unternehmen die Kosten und den Energiebedarf von KI-Anwendungen senken und die Nutzung auf unterschiedlichster Hardware ermöglichen.
/artikel/ora-computing-wiener-ki-startup-holt-35-mio-euro-seed-finanzierung
24.06.2026

Ora Computing: Wiener KI-Startup holt 3,5 Mio. Euro Seed-Finanzierung

Das Wiener KI-Startup Ora Computing hat eine Seed-Finanzierung über 3,5 Millionen Euro abgeschlossen. Mit seiner Technologie zur effizienten Komprimierung großer KI-Modelle will das Unternehmen die Kosten und den Energiebedarf von KI-Anwendungen senken und die Nutzung auf unterschiedlichster Hardware ermöglichen.
/artikel/ora-computing-wiener-ki-startup-holt-35-mio-euro-seed-finanzierung
Ora Computing
© Ora Computing - (l.) Stefan Sack und Raimel Medina.

Ora Computing, ein Startup, das sich auf die Optimierung und Komprimierung von KI-Foundation-Modellen spezialisiert hat, gab heute den Abschluss einer Seed-Finanzierungsrunde in Höhe von 3,5 Millionen Euro bekannt. Die Runde wurde von Constructor Capital und Greencode Ventures angeführt, mit fortgesetzter Unterstützung des Gründungsinvestors XISTA Science Ventures, der beim Aufbau und der Einführung des Unternehmens geholfen hat.

Ora Computing schrumpft Modelle

KI-Inferenz – der Prozess der tatsächlichen Ausführung eines KI-Modells zur Generierung von Outputs – ist zu einem erheblichen und schnell wachsenden Kostenfaktor für jedes Unternehmen geworden, das KI im großen Maßstab einsetzt. Große Implementierungen können mittlerweile allein für die Rechenleistung zig Millionen Euro pro Monat kosten, und das Problem verschärft sich, da die Modelle immer größer werden. Für Unternehmen, die KI lokal auf Geräten wie Autos oder Industrieanlagen ausführen möchten, seien die Modelle oft schlichtweg zu groß.

Hier setzt Ora Computing an. Seine Software komprimiert diese Modelle – sie schrumpft ihre Größe um bis zu 80 Prozent und lässt sie bis zu viermal schneller laufen – während der Genauigkeitsverlust bei Null bis fünf Prozent gehalten wird, so der Claim.

Da komprimierte Modelle deutlich weniger Rechenleistung für die Ausführung benötigen, sollen sich die Effizienzgewinne auch direkt in einem geringeren Energieverbrauch und reduzierten CO2-Emissionen niederschlagen: Ora schätzt, dass seine Technologie bei einer Marktdurchdringung von ein Prozent jährlich mehr als 50.000 Tonnen CO2 einsparen könnte.

Ansatz über verschiedene Hardwaretypen

„Wir haben Ora Computing gegründet, um die Annahme infrage zu stellen, dass eine massive Skalierung erforderlich ist, um nutzbare Intelligenz zu erreichen. Wir glauben, dass die nächste Welle der KI-Einführung durch kompaktere Modelle vorangetrieben wird, die hocheffizient und für spezifische Anwendungsfälle optimiert sind, anstatt durch große, universelle Cloud-Modelle. Ora baut den Software- und Algorithmen-Stack auf, der diesen Übergang ermöglicht“, sagt Stefan Sack, CEO und Mitgründer von Ora Computing.

Im Gegensatz zu bestehenden Komprimierungstools funktioniere der Ansatz von Ora über verschiedene Hardwaretypen hinweg und füge sich direkt in Standard-Inferenz-Frameworks ein – ohne Änderung an der bestehenden Infrastruktur. Wo konkurrierende Ansätze eine binäre Entscheidung zwischen Komprimierungsstufen erzwingen, bilde der Algorithmus von Ora kontinuierlich den gesamten Kompromiss zwischen Modellgröße und Genauigkeit ab, sodass Unternehmen für ihre spezifischen Hardware- und Kostenbeschränkungen optimieren können, so der Mitgründer.

2025: Ora Computing tritt hervor

Ora wurde von Stefan Sack und Raimel Medina gegründet, beide Forscher im Bereich Quantencomputing aus der Serbyn-Gruppe am Institute of Science and Technology Austria (ISTA). Das Unternehmen verließ Ende 2025 den Stealth-Modus und möchte die frischen Mittel dazu nutzen, um das Team zu vergrößern, die Komprimierungsfähigkeiten auf die größten Frontier-Modelle auszuweiten und ein kommerzielles Produkt für Cloud-Inferenz-Anbieter und Unternehmen, die KI am Edge einsetzen, auf den Markt zu bringen.

Ora hat die Anwendbarkeit seiner Technologie nach eigenen Angaben an einem Modell mit 70 Milliarden Parametern nachgewiesen. Der Komprimierungsprozess beanspruchte hierbei wenige Stunden und verursachte Rechenkosten von unter 1.000 US-Dollar, wohingegen der bisherige Branchenstandard für vergleichbare Leistungen ein Vielfaches dieses Betrages erfordere.

„Hunger wächst schneller“

„Der Energiehunger der KI wächst schneller, als die Welt die Infrastruktur aufbauen kann, um ihn zu stillen. Ein wichtiger Ansatz ist es, die KI selbst effizienter zu machen, und genau das tut Ora. Modelle radikal zu komprimieren, ohne die Genauigkeit zu opfern, macht für ihre Kunden einen enormen Unterschied“, sagt Terhi Vapola, Gründerin und Managing Partner bei Greencode Ventures.

Und Valentino Jadrisko, Senior Associate bei Constructor Capital, ergänzt: „Die Ära der Brute-Force-KI stößt an ihre physikalischen Grenzen: Hyperscaler nehmen wieder Kernreaktoren in Betrieb, Frontier-Labs verbrennen Milliarden für Rechenleistung, Reasoning-Modelle vervielfachen die Inferenzkosten jedes Quartal. Die einzige nachhaltige Antwort besteht darin, den Betrieb von Frontier-KI drastisch günstiger zu machen. Das ist es, was Ora Computing tut: Sie komprimieren Frontier-LLMs so, dass sie überall laufen können – in der Cloud, im Auto, in der Hosentasche. Und das ist der Grund, warum Constructor Capital stolz darauf ist, ihre 3,5-Millionen-Euro-Seed-Runde als Co-Lead anzuführen.“

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Revolutionär oder überschätzt? Was DeepSeek für die KI-Welt bedeutet