20.02.2019

Botium: Wiener Startup macht Chatbots klüger

Startup-Portrait. Botium wurde von Christoph Börner und Florian Treml gegründet. Das Duo möchte mit seinem Startup sicherstellen, dass die Chatbots ihrer B2B-Kunden intelligent agieren. Wir sprachen mit Gründer Börner über die Zukunftspläne des Startups und die Qualitätssicherung von "Conversational-Interfaces" in der IT-Industrie.
/artikel/botium-startup-macht-chatbots-klueger
Botium, Chatbots, AI, Bots, Selenium
(c) Botium GmbH: Das Botium-Team entwickelte automatisierte Tests und Trainings für Chatbots

Christoph Börner und Florian Treml spielen nicht nur gemeinsam in der Rockband “We used to be royal”, sondern haben mit Botium auch gemeinsam ein Startup gegründet. Ihr Ziel ist es, Chatbot-basierte Kommunikation zwischen Unternehmen und Kunden auf einen hohen qualitativen Standard zu heben.

+++ The bots are here to stay: NearGroup and Poncho about the future of chatbots +++

Mit Botium raus aus der “Chatbot-Kinderstube”

Chatbots sprießen wöchentlich aus dem Boden. Immer mehr Unternehmen setzen auf diese “Helfer”, um ihre Dienstleistungen kosteneffizienter an die Kunden zu bringen. Das Problem dabei: Viele der Chatbot-Anwendungen stecken noch im Anfangsstadium ihrer Entwicklung und agieren oftmals starr und unflexibel. Botium hat dennoch das Potential der Dialogsysteme erkannt und möchte mit seinem Testautomationsframework Chatbots intelligenter machen.

USA: mit Chatbots 23 Milliarden US-Dollar Gehaltskosten einsparen

Wer noch immer an der rasanten Entwicklung und zunehmenden Bedeutung von Chatbots zweifelt, dem sei der Bericht von “business insider” ans Herz gelegt. Schätzungen zufolge werden in den USA in absehbarer Zeit rund 29 Prozent der Dienstleistungen im “Customer Service” automatisiert. Dadurch sollen jährlich rund 23 Milliarden US-Dollar an Gehaltskosten eingespart werden.

Von der Plattform “Venture Beat” lässt sich zudem entnehmen, dass sich bei einer Umfrage rund 51 Prozent der befragten Personen wünschen, dass Unternehmen und deren Kundendienste 24/7 erreichbar sein sollten.

Künstliche Maschinen trainieren

“AI, Machine Learning und Chatbots bewegen die IT-Industrie wie kaum ein anderes Thema. Amazons Alexa und Apples Siri sind nur zwei Beispiele rund um diesen Hype”, sagt Botium-Gründer Christoph Börner. “Obwohl Chatbots bereits fixer Bestandteil unseres Alltags sind, ist es um die Qualität der Antworten nicht immer gut bestellt. Allzu oft muss man sich mit Antworten wie ‘das verstehe ich nicht’ herumschlagen. Um genau das zu vermeiden, müssen künstliche Maschinen – genauso wie Menschen – geschult & trainiert werden”.

Open-Source-Framework

“Wir haben ein Open-Source-Framework entwickelt, mit dessen Hilfe automatisiert und in Sekundenschnelle die Chatbots unzählige Tests durchlaufen, sie trainieren und damit verbessern”, erklärt er. “Derzeit müssen entsprechende Tests manuell oder sehr umständlich mit Selenium oder Appium umgesetzt werden. Die Integration in vorhandene Entwicklungsprozesse muss dann jeder Kunde selbst customizen”.

Unendliche Anzahl möglicher Testfälle

Um die Qualität im Chatbot-Umfeld zu verbessern, sei laut Börner daher vor allem die Quantität der Test- und Trainingsfälle ausschlaggebend. “Je mehr Szenarien trainiert werden, desto intelligenter ist am Ende auch der Chatbot. Die Frage nach ‘ausreichender Testabdeckung’ ist noch schwieriger zu beantworten als üblich. User können einen Bot eigentlich alles fragen. Und das tun sie auch – zumindest in Form von einfachem Smalltalk. Die Anzahl möglicher Testfälle ist also unendlich”, erklärt Börner.

80 Prozent ähnliche Fragestellungen

Einnahmen macht das Unternehmen durch ihre vordefinierten Testsets. Die Praxis habe Botium gezeigt, dass die Testfälle ihrer Kunden in derselben Domäne zu einem sehr hohen Prozentsatz übereinstimmen. “Sprich, der Support-Bot von Telekom Unternehmen A muss zu 80 Prozent dieselben Fragen beantworten, wie der von Telekom-Unternehmen B oder C. Deshalb liefern wir diese 80 Prozent an Test- und Trainingsdaten gleich ‘out of the box’ – und das für die meisten Chatbot-Domänen wie Banking, Telekom, Customer Support oder etwa Tourism”, so Börner über den USP von Botium. Die Kunden müssten bloß ihre jeweiligen individuellen Testfälle hinzufügen.

Botium-Box

“Daneben gibt es viele allgemeine Datasets, wie beispielsweise ein Smalltalk-Testset, Humanifaction-Testset, Security- und GDPR. Das ganze natürlich in verschiedenen Sprachen. Zudem finden User in der Botium-Box einen Quickstart Wizard, um Bots in wenigen Minuten zu verbinden und Test-Environments auszuwählen. Auch Testgeräte in Laborumgebungen, erweitertes Test-Reporting und CI/CD Integration sind darin enthalten”, sagt der Gründer.

Erklärvideo zur Botium-Box

“Waschechte Informatiker”

Sein Team und er selbst seien “waschechte” Informatiker, so Börner. Ihnen liege “Coding” wesentlich mehr “Marketing & Sales”, so Börner. Nichtsdestotrotz hat die Botium-Mannschaft gelernt, die Hürden in diesem Bereich zu meistern und vielfältige Lösungen zu entwickeln. “Da geht es um Social-Media-Präsenz, Blog-Artikel und SEO. Vor allem aber war der Aufbau einer Open-Source-Community rund um unser Automationsframework Botium essentiell. Zusätzlich konnten wir einen Marketing erfahrenen Investor mit ins Boot holen”, sagt Börner.

200.000 Euro Investment in Aussicht

Botium wurde im März 2018 gegründet und konnte im Vorjahr einen Umsatz von 200.000 Euro aufweisen. Wie uns Börner weiters erläutert, erwarte das bisher eigenfinanzierte Unternehmen für heuer ein Investment von ebenfalls 200.000 Euro und verfolge große Ziele: “Wir möchten Botium als festen Industriestandard für die Automation, das Testing und Training von Chatbots weiter etablieren. Zudem erweitern wir unser Geschäftsfeld gerade um das Thema Entwicklung von Chatbots. In Zukunft werden wir Chatbots nicht nur trainieren und testen – wir werden schon die Planung und Entwicklung übernehmen können”, sagt der Börner.


⇒ Zur Homepage des Chatbot-Startups

⇒ Features-Roadmap

Redaktionstipps
Deine ungelesenen Artikel:
23.12.2024

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

OpenAI hat ein neues Sprachmodell vorgestellt, das die Diskussionen um Artificial General Intelligence (AGI) wieder anheizt. Was steckt dahinter?
/artikel/openai-modell-o3-artifical-general-intelligence
23.12.2024

Neues OpenAI-Modell o3: “Befinden uns auf neuem Terrain”

OpenAI hat ein neues Sprachmodell vorgestellt, das die Diskussionen um Artificial General Intelligence (AGI) wieder anheizt. Was steckt dahinter?
/artikel/openai-modell-o3-artifical-general-intelligence
Logo von OpenAI
Foto: Adobe Stock

Wenn OpenAI neue Dinge ankündigt, hört die KI-Szene hin. Klar, nicht jede Ankündigung des US-Unternehmens in den vergangenen zwei Jahren hatte dieselbe Tragweite wie jene vom 30. November 2022, als OpenAI den Start eines Chatbots namens ChatGPT verlautbaren ließ. Aber potenziell könnte jede Mitteilung des Unternehmens rund um CEO Sam Altman bahnbrechend sein. Kein Wunder also, dass es für Aufsehen sorgte, als OpenAI Anfang Dezember verlautbarte, zwölf Tage hintereinander neue Dinge vorzustellen.

Schon in der Ankündigung hatte Altman darauf hingewiesen, dass es neben größeren auch kleinere Neuigkeiten sein würden, die OpenAI liefern würde. So kam es dann auch: Zugang zu ChatGPT über WhatsApp oder die Integration in Apple Intelligence waren eher in die zweite Kategorie einzuordnen. Daneben veröffentlichte OpenAI aber auch das neue Modell o1 für ChatGPT – oder Sora, ein Tool zur Videoerstellung.

Den größten Widerhall in der KI-Szene fand allerdings die Ankündigung am letzten der zwölf Tage. Am vergangenen Freitagabend stellte OpenAI sein neues Modell o3 vor. Wichtig dabei: Das Modell ist noch nicht öffentlich zugänglich. OpenAI stellte zunächst einmal nur vor, wie das Modell in unterschiedlichen KI-Benchmarks abschnitt. Aber diese Ergebnisse hatten es in sich.

o3 zeigt starke Performance bei AGI-Benchmark

Vielbeachtet wurde dabei vor allem die Benchmark namens ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence), bei der zwei Varianten des o3-Modells deutlich bessere Ergebnisse erzielten als die bisher führenden o1-Modelle. Das Ziel von ARC-AGI ist es zu messen, wie sich eine KI im Umgang mit ihr unbekannten Aufgaben schlägt.

Wie die O3-Modelle verglichen mit anderen OpenAI-Modellen abschneiden // Grafik: ARC Prize

Es gibt unterschiedliche Definitionen von AGI. Die meisten davon verstehen AGI aber als ein System, das sämtliche intellektuellen Aufgaben mindestens so gut oder besser als ein Mensch erledigen kann.

Die ARC-AGI-Benchmark wurde von François Chollet konzipiert. Er definiert AGI als ein System, das “in der Lage ist, effizient neue Fähigkeiten zu erwerben und neuartige Probleme zu lösen, für die es trainiert wurde.”

Eine AGI ist also nicht für eine bestimmte Aufgabe trainiert, sondern kann jegliche Aufgaben übernehmen. Es ist weitgehender Konsens in der KI-Szene, dass solche Systeme noch nicht existieren. OpenAI wurde aber beispielsweise explizit mit dem Ziel gegründet, AGI zu erreichen.

Chollet gehört zu den bekanntesten Namen der internationalen KI-Szene. Er hat die bekannte KI-Library Keras entwickelt und seit einigen Jahren für Google tätig. Dem von ChatGPT ausgelösten Hype rund um generative KI steht Chollet seit Anfang an eher kritisch gegenüber, wie beispielsweise auch dieser brutkasten-Bericht wenige Wochen nach Erscheinen von ChatGPT thematisierte.

o3: “Wir befinden uns auf neuem Terrain”

Umso interessanter ist es, was Chollet nun zu den Ergebnissen des o3-Modells bzw. seiner Varianten zu sagen hat. In einem Blogeintrag attestiert er OpenAI, mit dem Modell einen “bedeutenden Sprung nach vorne” erreicht zu haben.

Die Performance des Modells stelle “einen echten Durchbruch” in der Anpassungsfähigkeit und Verallgemeinerung” von KI-Modellen dar”, wenn es darum gehe, wie sich KI-Modelle an neue Aufgaben anpassen könnten. o3 stelle nicht bloß einen “schrittweisen Fortschritt” dar. Vielmehr befinde man sich auf “neuem Terrain”, das “ernsthafte wissenschaftliche Aufmerksamkeit” erfordere.

Aber es ist schon Artificial General Intelligence (AGI)? Hier schränkt Chollet ein: “o3 scheitert immer noch an einigen sehr einfachen Aufgaben, was auf grundlegende Unterschiede zur menschlichen Intelligenz hinweist”. Dennoch befeuerten die Ergebnisse die Diskussion rund um AGI – und manche Stimmen sahen, anderes als Chollet, mit o3 AGI sogar bereits erreicht.

Selbst wenn dem so wäre, wäre es zum jetzigen Zeitpunkt schwer nachzuprüfen: Denn das Modell ist noch nicht veröffentlicht. Forscher:innen im Bereich der KI-Sicherheit können sich für Zugang vormerken lassen. Wann und zu welchen Konditionen das Modell für Endnutzer:innen zugänglich sein wird, ist aktuell noch unklar. Klar ist allerdings schon jetzt, dass die beeindruckenden Ergebnisse bei der ARC-AGI-Benchmark enorme Rechenressourcen erforderten – und dementsprechend teuer waren.

Reasoning-Modelle

Das o3-Modell ist eine verbesserte Version des o1-Modells, welches OpenAI am 4. Dezember veröffentliche und das zuvor bereits in Preview- und Mini-Varianten für ChatGPT-User:innen zugänglich gewesen war. Dieses Modell unterscheidet sich zu dem im Mai 2024 veröffentlichten GPT4o-Modell insofern, als es auf einen “Reasoning”-Ansatz setzt.

OpenAI bezeichnet GPT4o weiterhin als das “vielseitige, hochintelligente Flagship-Modell”, das für die “meisten Aufgaben” die richtige Wahl sei. Die o1-Modelle wiederum referenziert das Unternehmen als “Reasoning-Modelle, die sich bei komplexen, mehrstufigen Aufgaben auszeichnen”.

Enduser:innen von ChatGPT merken dies in der Nutzung vor allem insofern, als sich die o1-Modelle länger Zeit nehmen, Ergebnisse zu produzieren. Diese Modelle “verbringen mehr Zeit mit Nachdenken, bevor sie reagieren”, wie es OpenAI formuliert. In einigen (aber nicht notwendigerweise in allen) Bereichen liefern sie dann deutlich bessere Ergebnisse als die bisherigen Modelle.


Tipp der Redaktion: Die neue brutkasten-Serie “No Hype KI”

No Hype KI
Nach zwei Jahren ChatGPT liefern wir eine Bestandsaufnahme aus der österreichischen Wirtschaft – wo stehen wir wirklich?
Du willst bei "No Hype KI" am Laufenden bleiben?

Trag dich hier ein und du bekommst jede Folge direkt in die Inbox!

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Botium: Wiener Startup macht Chatbots klüger

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Botium: Wiener Startup macht Chatbots klüger

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Botium: Wiener Startup macht Chatbots klüger

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Botium: Wiener Startup macht Chatbots klüger

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Botium: Wiener Startup macht Chatbots klüger

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Botium: Wiener Startup macht Chatbots klüger

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Botium: Wiener Startup macht Chatbots klüger

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Botium: Wiener Startup macht Chatbots klüger

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Botium: Wiener Startup macht Chatbots klüger