✨ AI Kontextualisierung
Künstliche Intelligenz (und insbesondere Generative AI) gilt aktuell als einer der wenigen Bereiche, die dem allgemeinen Downturn in der Startup-Szene standhalten. Investments in AI sind vergleichsweise stabil und es entstehen immer mehr KI-Startups. VCs, die ihren Dealflow prüfen, stellen sich dabei natürlich oft die Frage, ob die Qualität des Machine-Learning-Setups tatsächlich hält, was das Pitchdeck oder die Equity Story verspricht. In diesem Artikel empfehle ich drei Fragen, die jeder VC auf dem Schirm haben sollte, wenn er sich ein KI-Startup anschaut.
Erste Frage: Handelt es sich wirklich um ML oder um ein traditionelles regelbasiertes System?
Zu Anfang sollte man einmal klären, ob das Startup wirklich mit Machine Learning arbeitet oder eher mit einem selbstentwickelten, regelbasierten System. Ist das System selbstlernend und verbessert es sich, wenn es mit mehr Daten trainiert wird? Dann handelt es sich um ML. Darüber hinaus umfasst selbstlernende ML auch selbstüberwachte oder unüberwachte Methoden. Die Frage, ob und wie man eine solche Selbstverbesserung am besten ermöglicht, wird als “Online-Lernen” bezeichnet.
Wenn es sich um ein System handelt, das nach bestimmten Regeln arbeitet, die von Entwicklern im Voraus festgelegt werden, und das nicht mit Daten oder selbstlernend trainiert wird, ist das in der Regel keine echte KI – zumindest nicht im aktuellen Verständnis.
Zweite Frage: Make or Buy?
Die zweite Frage lautet: Wurde das ML-Modell selbst entwickelt oder wird ein Open-Source- oder proprietäres Modell von Drittanbietern genutzt? Wenn es sich um Open-Source-Modelle handelt, passen die Unternehmen diese Modelle sehr oft für den eigenen Business-Case an. In diesem Fall wird nicht wirklich etwas von Grund auf neu entwickelt, aber es wird auch nicht einfach etwas übernommen, das bereits existiert. Ein Beispiel wäre die jüngste Entwicklung von ChatGPT, bei der die GPT-Modelle von Open.AI verwendet werden können. Sie sind Open Source, und man kann sie unter bestimmten Lizenzmodellen für das eigene Business nutzen.
Die Unterscheidung besteht also darin, ob es sich um externe ML-Fähigkeiten handelt, die für das eigene Business-Modell genutzt und gegebenfalls angepasst werden, oder ob es sich um selbst entwickelte ML handelt. Bei Letzterem handelt es sich dann in der Regel um Deep-Tech-Startups, die eigene Foundation Models oder Large Language Models (LLM) entwickeln und in denen ein viel tieferes technologisches Wissen im Unternehmen vorhanden ist.
Dritte Frage: Mit welchen Daten wurde das ML-Modell trainiert und wem gehören sie?
ML-Modelle entwickeln sich zunehmend zu einer Ware. Der Zugang zu einem ML-Modell stellt also kein Differenzierungsmerkmal mehr für Startups dar. Die wirklich interessante Frage wird sein, von wem und auf welche Weise diese Modelle trainiert wurden. Und mit welcher Art und Menge von Daten.
Wenn das Unternehmen eigene Daten verwendet, gibt es zwei Dimensionen zu bedenken. Erstens: Die Menge der Datenpunkte im Datensatz. Es geht also darum, zu verstehen, wie statistisch signifikant bestimmte Effekte in diesem Datensatz sind. Ein größerer Datensatz ist immer interessanter, da statistische Fehler besser ausgeschlossen werden können und ein höheres Maß an Vertrauen entsteht. Dabei darf der Aspekt der Datenvielfalt nicht unterschätzt werden. Wie gut decken die verfügbaren Daten den Raum ab, in dem das Model lebt. Einige Unternehmen sind in der Lage, riesige Datensätze aus ihren eigenen Betrieben zu produzieren. Oft besteht aber das Problem, dass Datensätze zu klein sind, um wesentliche Verbesserungen in den Ergebnissen der AI zutage zu fördern.
Die zweite Dimension betrifft die Frage nach den Besitzverhältnissen der Daten. Wie ist das Unternehmen an diesen Datensatz gekommen? Ist er öffentlich zugänglich? Wurden sie von bestimmten Lieferanten bezogen? Oder werden sie vielleicht sogar von dem Unternehmen selbst gesammelt? Proprietäre Daten werden in den kommenden Jahren einen echten Wettbewerbsvorteil darstellen. Je privater der Datensatz ist, desto stärker sind die Fähigkeiten des Unternehmens, einen bestimmten Business Case zu bedienen und damit ein erfolgreiches Geschäftsmodell aufzubauen.
Fazit
Unterm Strich sollten VCs also folgende Fragen auf dem Schirm haben: Zuerst muss man herausfinden, ob das Unternehmen wirklich ML-Modelle vorweisen kann oder ob es sich um regelbasierte Systeme handelt. Zweitens müsste man klären, ob das Modell gekauft oder selbst entwickelt wurde. Und drittens muss hinterfragt werden, mit welchen Daten das Modell trainiert wurde. Und hier gilt: Je größer, vielfältiger und privater der Datensatz ist, desto besser für den Aufbau eines differenzierten Modells und den potenziellen Erfolg eines KI-Startups.
Über den Autor
Simon Brendel ist Director New Business beim Beratungsunternehmen Philipps & Byrne mit Sitz in Berlin, das auf Tech Due Diligence spezialisiert ist. Zur Zielgruppe des Unternehmens zählen Investo:innen, Growth-Stage-Startups und Unternehmer:innen. Brendel thematische Schwerpunkte sind unter anderem Themen Strategie, Technologie und Innovationen.