15.07.2019

Was macht eigentlich ein Data Scientist?

Das Buzzword "Data Science" geistert derzeit durch die Innovationsabteilungen quer über alle Branchen hinweg. Der Job-Titel "Data Scientist" ist einer der häufigsten in einschlägigen Karriere-Plattformen. Doch worum geht es dabei eigentlich? Wir haben mit drei sehr unterschiedlichen Data Scientists gesprochen.
/artikel/was-macht-ein-data-scientist
Was macht eigentlich ein Data Scientist? Wir haben das Sclable-Data Science-Team gefragt
(c) Tobias Fittner: Das Sclable-AI- und Data Science-Team (vlnr.): Sanchit Singh, Ronald Luc, Frank Fichtenmüller, Charles Dietz und Viktor Sandner

“Data Science bezeichnet generell die Extraktion von Wissen aus Daten” – so lautet die verkürzte Definition auf Wikipedia. Daraus lässt sich eines bereits klar ableiten: Der Beruf “Data Scientist” lässt sich nicht auf einzelne spezifische Tätigkeiten eingrenzen. Tatsächlich bietet der Job, der auf einschlägigen Karriere-Plattformen von Unternehmen jeder Größe derzeit stark nachgefragt wird, einen großen Spielraum. Dabei sind ganz unterschiedliche Kompetenzen vonnöten.

+++ Mehr zum Thema Human Ressources +++

“Lauter offene Münder”

Ein Unternehmen, bei dem Data Science zum Kerngeschäft gehört, ist der Business Accelerator Sclable mit Hauptsitz im Wiener weXelerate. Dort unterstützt man seit sieben Jahren Kunden aus der nationalen und internationalen traditionellen Industrie wie Umdasch Group Ventures und ihr Schwesterunternehmen Doka oder Palfinger in Sachen digitale Transformation. Ein entscheidender Faktor ist dabei die Nutzung von Daten, um Prozesse effizienter zu machen. “Du löst dabei etwas, das für dich eine absolute ‘low hanging fruit’ ist. Aber beim Kunden siehst du bei der Präsentation der Ergebnisse lauter offene Münder”, sagt Viktor Sandner, Head of Data Science and Methodology bei Sclable.

“Es gibt keinen Data Science Fullstack Developer”

Die Nische Finden

Sandner kommt eigentlich aus dem Biotech-Bereich. “Ich bin in meiner Forschung mit Excel-Tabellen bald an meine Grenzen gestoßen. Ich habe daher programmieren gelernt und es hat sich plötzlich eine ganze neue Welt offenbart”, erzählt er. So habe er begonnen, nach Daten-Lösungen für die gesamte Branche zu suchen und sei damit zum “Experten mit einem gewissen Extra” geworden – konkret im Bereich Statistik. Denn eines müsse man im breiten Feld der Data Science finden, um zu reüssieren: Eine Nische.

Diverses Data Science-Team

“Es gibt keinen Data Science Fullstack Developer”, sagt auch Sandners Kollege Ronald Luc, Machine Learning Engineer bei Sclable, und ebenfalls ein “Data Scientist”. Man brauche ein diverses Team. Während sich Viktor Sandner mit statistischen Methoden auf die Suche nach teilweise versteckten Korrelationen in großen Datensets macht, ist Lucs Domäne die Vorhersage von Werten mit Hilfe von Deep Learning – teilweise auf Basis von durch seinen Kollegen aufbereiteten Daten. “Manchmal sind aber gar keine Daten vorhanden. Dann erstelle ich mit Hilfe von detaillierten Interviews ein mathematisches Modell zur Vorhersage”, erklärt Luc.

Es braucht nicht immer Deep Learning

Ein weiteres Feld der Data Science deckt bei Sclable Sanchit Singh ab. Der Head of Computer Vision beschäftigt sich mit der Analyse von zwei- und dreidimensionalen Bild-Inhalten. Auch er arbeitet mit Deep Learning – das sei aber nicht zwingend notwendig. “Es lässt sich vieles mit dem klassischen Computer Vision-Ansatz machen, wo auf Basis von mathematischen Modellen Vergleiche durchgeführt werden und Klassifikationen erstellt werden können”, erklärt Singh. Als Beispiel nennt er, der ursprünglich aus dem Medizin-Bereich kommt, die Hautkrebs-Forschung. Dort könnten Bilder von Haut-Anomalien etwa nach dem Abgleich der Parameter Farbe, Form und Symmetrie sehr treffsicher kategorisiert werden. “Das kann z.B. einem Allgemeinmediziner helfen, der selten mit der Krankheit konfrontiert ist, eine erste Verdachtsdiagnose zu stellen”, sagt der Computer Vision-Experte.

Das unvoreingenommene Programm

Deep Learning bringe aber freilich weitere Möglichkeiten. Hier bestünden zwei Ansätze: “Supervised Learning” und “Unsupervised Learning”. “Während ich beim ‘Supervised Learning’ gewisse Informationen einfüttere – in unserem Beispiel etwa die bereits als Hautkrebs klassifizierte Bilder, die dem Programm als Grundlage dienen, ist es beim ‘Unsupervised Learning’ quasi unvoreingenommen und bildet selbstständig Cluster”, erklärt Singh. Dieser Zugang könne unerwartete Zusammenhänge und damit neue Erkenntnisse ans Tageslicht bringen.

Big Data als Fluch und Segen

Voraussetzung für das Gelingen sei gerade beim “Unsupervised Learning”, aber auch in den anderen “Data Science”-Bereichen, das Vorhandensein ausreichender Datenmengen. Und diese können sich für Data Scientists als Fluch und Segen zugleich erweisen. “Wir sprechen hier von Big Data. Je nachdem, um was für Daten es sich handelt, können Datensets aber auch zu groß werden, um sie bearbeiten zu können. Gerade bei Bildern und Videos ist man sehr schnell im Terrabyte-Bereich und muss dann gegebenenfalls ein kleineres Datenset heranziehen oder an großen Computing-Clustern arbeiten”, erklärt Ronald Luc.

Data Scientist – “ein Blick” für Daten

Und das ist nicht die einzige Herausforderung, mit der man als Data Scientist konfrontiert ist. “Kunden haben häufig zwar große Mengen an Daten, wissen aber gar nicht, was sie damit anfangen können und können daher auch keine Ziele für die Analyse definieren”, erzählt Viktor Sandner. In anderen Fällen würden die Ziele nicht mit den verfügbaren Daten zusammenpassen. “Das kann man aber sehr schnell herausfinden. Nach einiger Zeit hat man einen Blick dafür und sieht sofort, ob das Unterfangen erfolgsversprechend ist”.

“Ich lese jeden Tag zum Frühstück ein Paper”

Ausruhen könne man sich darauf aber nicht. Denn die rapide Entwicklung in dem Bereich erfordere ständige Anpassung. “Die gesamte Technologie, die wir verwenden, ändert sich alle paar Monate”, sagt Sanchit Singh. Für Ronald Luc ergibt sich dadurch eine besondere Morgen-Routine: “Ich lese jeden Tag zum Frühstück ein Paper”.

Redaktionstipps
Deine ungelesenen Artikel:
16.12.2024

“Die Zeit des Zuwartens ist vorbei”

Nachlese. Wo steht die österreichische Wirtschaft bei künstlicher Intelligenz zwei Jahre nach Erscheinen von ChatGPT? Dies diskutieren Doris Lippert von Microsoft und Thomas Steirer von Nagarro in der ersten Folge der neuen brutkasten-Serie "No Hype KI".
/artikel/no-hype-ki-folge-1-nachlese
16.12.2024

“Die Zeit des Zuwartens ist vorbei”

Nachlese. Wo steht die österreichische Wirtschaft bei künstlicher Intelligenz zwei Jahre nach Erscheinen von ChatGPT? Dies diskutieren Doris Lippert von Microsoft und Thomas Steirer von Nagarro in der ersten Folge der neuen brutkasten-Serie "No Hype KI".
/artikel/no-hype-ki-folge-1-nachlese
Doris Lippert (Microsoft | Director Global Partner Solutions und Mitglied der Geschäftsleitung) und Thomas Steirer (Nagarro | Chief Technology Officer)
Doris Lippert (Microsoft | Director Global Partner Solutions und Mitglied der Geschäftsleitung) und Thomas Steirer (Nagarro | Chief Technology Officer) | Foto: brutkasten

“No Hype KI” wird unterstützt von CANCOM Austria, IBM, ITSV, Microsoft, Nagarro, Red Hat und Universität Graz


Mit der neuen multimedialen Serie “No Hype KI” wollen wir eine Bestandsaufnahme zu künstlicher Intelligenz in der österreichischen Wirtschaft liefern. In der ersten Folge diskutieren Doris Lippert, Director Global Partner Solutions und Mitglied der Geschäftsleitung bei Microsoft Österreich, und Thomas Steirer, Chief Technology Officer bei Nagarro, über den Status Quo zwei Jahre nach Erscheinen von ChatGPT.

Du willst bei "No Hype KI" am Laufenden bleiben?

Trag dich hier ein und du bekommst jede Folge direkt in die Inbox!

„Das war ein richtiger Hype. Nach wenigen Tagen hatte ChatGPT über eine Million Nutzer”, erinnert sich Lippert an den Start des OpenAI-Chatbots Ende 2022. Seither habe sich aber viel geändert: “Heute ist das gar kein Hype mehr, sondern Realität“, sagt Lippert. Die Technologie habe sich längst in den Alltag integriert, kaum jemand spreche noch davon, dass er sein Smartphone über eine „KI-Anwendung“ entsperre oder sein Auto mithilfe von KI einparke: “Wenn es im Alltag angekommen ist, sagt keiner mehr KI-Lösung dazu”.

Auch Thomas Steirer erinnert sich an den Moment, als ChatGPT erschien: „Für mich war das ein richtiger Flashback. Ich habe vor vielen Jahren KI studiert und dann lange darauf gewartet, dass wirklich alltagstaugliche Lösungen kommen. Mit ChatGPT war dann klar: Jetzt sind wir wirklich da.“ Er sieht in dieser Entwicklung einen entscheidenden Schritt, der KI aus der reinen Forschungsecke in den aktiven, spürbaren Endnutzer-Bereich gebracht habe.

Von erster Begeisterung zu realistischen Erwartungen

Anfangs herrschte in Unternehmen noch ein gewisser Aktionismus: „Den Satz ‘Wir müssen irgendwas mit KI machen’ habe ich sehr, sehr oft gehört“, meint Steirer. Inzwischen habe sich die Erwartungshaltung realistischer entwickelt. Unternehmen gingen nun strategischer vor, untersuchten konkrete Use Cases und setzten auf institutionalisierte Strukturen – etwa durch sogenannte “Centers of Excellence” – um KI langfristig zu integrieren. „Wir sehen, dass jetzt fast jedes Unternehmen in Österreich KI-Initiativen hat“, sagt Lippert. „Diese Anlaufkurve hat eine Zeit lang gedauert, aber jetzt sehen wir viele reale Use-Cases und wir brauchen uns als Land nicht verstecken.“

Spar, Strabag, Uniqa: Use-Cases aus der österreichischen Wirtschaft

Lippert nennt etwa den Lebensmittelhändler Spar, der mithilfe von KI sein Obst- und Gemüsesortiment auf Basis von Kaufverhalten, Wetterdaten und Rabatten punktgenau steuert. Weniger Verschwendung, bessere Lieferkette: “Lieferkettenoptimierung ist ein Purpose-Driven-Use-Case, der international sehr viel Aufmerksamkeit bekommt und der sich übrigens über alle Branchen repliziert”, erläutert die Microsoft-Expertin.

Auch die Baubranche hat Anwendungsfälle vorzuweisen: Bei Strabag wird mittels KI die Risikobewertung von Baustellen verbessert, indem historische Daten zum Bauträger, zu Lieferanten und zum Bauteam analysiert werden.

Im Versicherungsbereich hat die UNIQA mithilfe eines KI-basierten „Tarif-Bots“ den Zeitaufwand für Tarifauskünfte um 50 Prozent reduziert, was die Mitarbeiter:innen von repetitiven Tätigkeiten entlastet und ihnen mehr Spielraum für sinnstiftende Tätigkeiten lässt.

Nicht immer geht es aber um Effizienzsteigerung. Ein KI-Projekt einer anderen Art wurde kürzlich bei der jüngsten Microsoft-Konferenz Ignite präsentiert: Der Hera Space Companion (brutkasten berichtete). Gemeinsam mit der ESA, Terra Mater und dem österreichischen Startup Impact.ai wurde ein digitaler Space Companion entwickelt, mit dem sich Nutzer in Echtzeit über Weltraummissionen austauschen können. „Das macht Wissenschaft zum ersten Mal wirklich greifbar“, sagt Lippert. „Meine Kinder haben am Wochenende die Planeten im Gespräch mit dem Space Companion gelernt.“

Herausforderungen: Infrastruktur, Daten und Sicherheit

Auch wenn die genannten Use Cases Erfolgsbeispiele zeigen, sind Unternehmen, die KI einsetzen wollen, klarerweise auch mit Herausforderungen konfrontiert. Diese unterscheiden sich je nachdem, wie weit die „KI-Maturität“ der Unternehmen fortgeschritten sei, erläutert Lippert. Für jene, die schon Use-.Cases erprobt haben, gehe es nun um den großflächigen Rollout. Dabei offenbaren sich klassische Herausforderungen: „Integration in Legacy-Systeme, Datenstrategie, Datenarchitektur, Sicherheit – all das darf man nicht unterschätzen“, sagt Lippert.

“Eine große Herausforderung für Unternehmen ist auch die Frage: Wer sind wir überhaupt?”, ergänzt Steirer. Unternehmen müssten sich fragen, ob sie eine KI-Firma seien, ein Software-Entwicklungsunternehmen oder ein reines Fachunternehmen. Daran anschließend ergeben sich dann Folgefragen: „Muss ich selbst KI-Modelle trainieren oder kann ich auf bestehende Plattformen aufsetzen? Was ist meine langfristige Strategie?“ Er sieht in dieser Phase den Übergang von kleinen Experimenten über breite Implementierung bis hin zur Institutionalisierung von KI im Unternehmen.

Langfristiges Potenzial heben

Langfristig stehen die Zeichen stehen auf Wachstum, sind sich Lippert und Steirer einig. „Wir überschätzen oft den kurzfristigen Impact und unterschätzen den langfristigen“, sagt die Microsoft-Expertin. Sie verweist auf eine im Juni präsentierte Studie, wonach KI-gestützte Ökosysteme das Bruttoinlandsprodukt Österreichs deutlich steigern könnten – und zwar um etwa 18 Prozent (brutkasten berichtete). „Das wäre wie ein zehntes Bundesland, nach Wien wäre es dann das wirtschaftsstärkste“, so Lippert. „Wir müssen uns klar machen, dass KI eine Allzwecktechnologie wie Elektrizität oder das Internet ist.“

Auch Steirer ist überzeugt, dass sich für heimische Unternehmen massive Chancen eröffnen: “Ich glaube auch, dass wir einfach massiv unterschätzen, was das für einen langfristigen Impact haben wird”. Der Appell des Nagarro-Experten: „Es geht jetzt wirklich darum, nicht mehr zuzuwarten, sondern sich mit KI auseinanderzusetzen, umzusetzen und Wert zu stiften.“


Folge nachsehen: No Hype KI – wo stehen wir nach zwei Jahren ChatGPT?


Die Serie wird von brutkasten in redaktioneller Unabhängigkeit mit finanzieller Unterstützung unserer Partner:innen produziert.

Die Partner von No Hype KI
Die Partner von No Hype KI
Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Was macht eigentlich ein Data Scientist?

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Was macht eigentlich ein Data Scientist?

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Was macht eigentlich ein Data Scientist?

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Was macht eigentlich ein Data Scientist?

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Was macht eigentlich ein Data Scientist?

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Was macht eigentlich ein Data Scientist?

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Was macht eigentlich ein Data Scientist?

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Was macht eigentlich ein Data Scientist?

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Was macht eigentlich ein Data Scientist?